大模型時(shí)代,個(gè)性化學(xué)習(xí)有了更多的可能性。

九章隨時(shí)問國朝游:未來步驟級的診斷+答疑,或許是個(gè)性化學(xué)習(xí)的終極答案

2024-08-19 21:28:18發(fā)布     來源:多知    作者:國朝游  

  源|多知

  作者|國朝游

  攝|王上

  近日,在多知OpenTalk第46期“教育新生態(tài):AI學(xué)伴、AI老師來了”活動上,學(xué)而思九章隨時(shí)問產(chǎn)品負(fù)責(zé)人國朝游以九章隨時(shí)問為例,分享了大模型如何幫助解決個(gè)性化學(xué)習(xí)的難題。

  在國朝游看來,對于傳統(tǒng)的教育行業(yè)來說,個(gè)性化、高質(zhì)量和大規(guī)模這個(gè)“不可能三角”是非常突出的。在大模型時(shí)代來臨后,個(gè)性化學(xué)習(xí)有了更多的解法。

  第一,大語言模型有強(qiáng)大的理解和對話能力,這就意味著可以通過更自然的AI交互的方式采集到學(xué)生的反饋和數(shù)據(jù)。大模型用于給學(xué)生“答疑”成為可能。第二,學(xué)生的學(xué)習(xí)過程,通過對話體現(xiàn)出來,讓數(shù)據(jù)驅(qū)動的過程性評價(jià)成為可能。這樣,結(jié)合大模型的理解能力以及數(shù)據(jù)采集分析能力,最后就能形成一個(gè)更個(gè)性化的解決方案。

  九章隨時(shí)問便是在這一背景下誕生。據(jù)透露,自2024年5月以來,“九章隨時(shí)問”的微信小程序、iOS和安卓APP陸續(xù)上線,超過1/5的用戶在完成講題后,主動反饋“非常有幫助”。

  國朝游透露,團(tuán)隊(duì)在題目級別的知識點(diǎn)標(biāo)簽上更深一步,探索步驟級別的知識點(diǎn)標(biāo)簽。他認(rèn)為,未來步驟級的診斷+答疑,或許是個(gè)性化學(xué)習(xí)的終極答案。

  以下為國朝游的分享,經(jīng)多知編輯:

  01

  大模型時(shí)代,個(gè)性化學(xué)習(xí)有了更多的可能性

  大家好。今天我演講的主題是《大模型時(shí)代的個(gè)性化學(xué)習(xí)探索》。這個(gè)主題有點(diǎn)大,我今天會以“九章隨時(shí)問”這個(gè)產(chǎn)品為例,從一個(gè)小切入點(diǎn)延展出我們的思考。

  “九章隨時(shí)問”是基于學(xué)而思自主研發(fā)的九章大模型研發(fā)出的一款數(shù)學(xué)搜索答疑工具。

  不同行業(yè)都會提到“不可能三角”的概念。對于傳統(tǒng)的教育行業(yè)來說,個(gè)性化、高質(zhì)量和大規(guī)模這個(gè)“不可能三角”是非常突出的。

  那AI如何可能打破這個(gè)“不可能三角”?

  在大規(guī)模方面,AI有天然優(yōu)勢。在高質(zhì)量方面,如何讓AI越來越聰明,在各個(gè)環(huán)節(jié)上的表現(xiàn)越來越好,是我們一直努力提升的方向。而AI助力個(gè)性化方面,我們是怎樣在一個(gè)具體的場景嘗試實(shí)現(xiàn)個(gè)性化,這是我今天想聊的話題。

  我們的思路是,我們先找了一個(gè)具體的個(gè)性化學(xué)習(xí)的場景——課后從題目練習(xí)到知識鞏固的鏈路。在這個(gè)環(huán)節(jié),有沒有解決方案能在學(xué)生遇到不會做題的時(shí)候幫他解決?

  傳統(tǒng)的解決方案就是學(xué)生答題,答完題之后,自己看參考答案。不足之處是,答錯(cuò)、不會做的題目,學(xué)生只知道正確答案,解題過程依然不會,而且解析過程簡略,不明白的推導(dǎo)步驟無人解答,只能自學(xué)理解。這時(shí),他們已經(jīng)很難通過自學(xué)來達(dá)到做題、知識點(diǎn)鞏固的正向循環(huán)。

  到了大模型時(shí)代,有了更多的可能性:

  第一,大語言模型有強(qiáng)大的理解和對話能力,這就意味著可以通過更自然的AI交互的方式采集到學(xué)生的反饋和數(shù)據(jù)。大模型用于給學(xué)生“答疑”成為可能。

  第二,學(xué)生的學(xué)習(xí)過程,通過對話體現(xiàn)出來,在每個(gè)步驟上的行為都被數(shù)據(jù)化,成為過程性評價(jià)的數(shù)據(jù)抓手,實(shí)現(xiàn)從結(jié)果評價(jià)到過程性評價(jià)的遷移。

  這樣,結(jié)合大模型的理解能力以及數(shù)據(jù)采集分析能力,最后就能形成一個(gè)更個(gè)性化的解決方案。

  以下圖的這道題為例,這是一道典型的題目。不同的學(xué)生在做這道題時(shí),可能會在不同的地方被卡住。

  

  不同學(xué)生在不同地方卡住,意味著他們對更細(xì)密度的知識點(diǎn)掌握情況是不一樣的,也就是說,學(xué)生們不會的點(diǎn)是不一樣的。如何找出他們每個(gè)人不會的點(diǎn)并給他們講會,就是我們嘗試做的個(gè)性化的思路。

  02

  定義“九章隨時(shí)問”

  對此,我們設(shè)想的解決思路是,當(dāng)學(xué)生這道題不會,尋求AI老師的幫助時(shí),首先判斷學(xué)生是否掌握了這道題背后的這個(gè)知識點(diǎn),如果沒有掌握,就講明白這個(gè)知識點(diǎn),然后再回到這道題的解答。這其實(shí)是最理想的一個(gè)方式。

  

  在這樣的思路下,我們開始設(shè)計(jì)“九章隨時(shí)問”這款產(chǎn)品。它其實(shí)聚焦了一個(gè)非常小的環(huán)節(jié),就是學(xué)生遇到了一道題不會時(shí),我們怎么為他講明白。

  學(xué)而思內(nèi)部有非常多的老師,我們會研究老師具體是怎樣給學(xué)生講會一道題的:老師會根據(jù)學(xué)生的反饋決定應(yīng)該講什么內(nèi)容、講到哪一步、用什么講法,因?yàn)樾枰獙W(xué)生反饋,看學(xué)生是否掌握,這就涉及診斷能力。這些過程結(jié)束之后,需要進(jìn)行題目總結(jié)、題目拓展和相似題推薦。

  拆解了真人老師是怎樣給學(xué)生講會這道題的過程后,我們很自然地就能了解這個(gè)講題大模型需要具備什么能力。

  自2024年5月以來,我們陸續(xù)上線了 “九章隨時(shí)問”的微信小程序、iOS和安卓APP,超過1/5的用戶在完成講題后,主動反饋“非常有幫助”。

  前段時(shí)間有個(gè)通用大模型在簡單數(shù)學(xué)題上集體翻車的熱點(diǎn)。我們當(dāng)天也去測試了一下九章隨時(shí)問,它是能夠比較好地講出來的。這體現(xiàn)出,通用大模型在垂類場景下,不一定能解決得特別好。在特定場景下,我們的垂類大模型有更加專業(yè)的老師,有更加海量的高質(zhì)量數(shù)據(jù),以及各種評測來優(yōu)化,我們在這方面也就做得更好。

  03

  未來步驟級的診斷+答疑,或許是個(gè)性化學(xué)習(xí)的終極答案

  我們之前在做知識點(diǎn)標(biāo)簽的時(shí)候,更多地是打在了題目級別,即“這道題你會了,這個(gè)知識點(diǎn)你就會了”,要是判斷不準(zhǔn),再多測幾道題,看看會不會這個(gè)知識點(diǎn)。

  但是如果用戶和AI是有交互的,我們能夠采集這道題每一步的講解數(shù)據(jù),判斷學(xué)生到底懂沒懂。因?yàn)橐坏李}背后,我們能夠?qū)λ拿總€(gè)步驟都打上一個(gè)非常詳細(xì)的能力標(biāo)簽、知識點(diǎn)標(biāo)簽。

  

  

  基于此,我們就可以得到一個(gè)非常個(gè)性化的每個(gè)學(xué)生的知識圖譜。同樣是這道題,不同學(xué)生某些知識點(diǎn)掌握情況是不一樣的,后面的講解策略、講解方式、講解內(nèi)容是可以做調(diào)整的。這會讓九章大模型在這個(gè)場景下更加個(gè)性化。

  其實(shí)在大模型場景下做個(gè)性化學(xué)習(xí),未來其實(shí)還有非常多的事情要做。我們也希望能夠和業(yè)內(nèi)更多的伙伴在這個(gè)場景做一些更多的交流和探索,持續(xù)克服大模型在學(xué)科領(lǐng)域,特別是在數(shù)學(xué)領(lǐng)域,天然比較難攻克的方面,以達(dá)到一個(gè)非常好的效果。

  我今天的分享就到這里,謝謝大家。

  04

  Q&A

  提問1:大家好,我是來自新東方的AI產(chǎn)品。我的疑問有兩個(gè),一個(gè)是學(xué)而思為什么會選擇從數(shù)學(xué)場景做大模型,因?yàn)榇竽P捅旧碓跀?shù)學(xué)的計(jì)算推理上有一定的缺陷,那么就意味著我們在解題過程中很有可能會出錯(cuò)。另外一個(gè)問題是,對于大模型目前在計(jì)算推理方面的問題,咱們目前是有一個(gè)什么樣的方案進(jìn)行解決?

  國朝游:我們選擇數(shù)學(xué)是基于幾方面考慮:

  第一,它確實(shí)很難,也意味著我們在這一塊有更多的可能性,我們希望能夠突破這個(gè)難點(diǎn)。并且做數(shù)學(xué)大模型在講題、答疑、批改等應(yīng)用場景非常廣闊。

  其二,學(xué)而思是以數(shù)學(xué)起家的,在數(shù)學(xué)方面也更有優(yōu)勢。

  關(guān)于如何解決大模型目前在計(jì)算推理方面的問題,我們從模型訓(xùn)練到后面的計(jì)算推理,做了非常多的算法嘗試和處理,這樣的case非常多。

  提問2:我在一家創(chuàng)業(yè)公司,我們現(xiàn)在也在做一些AI答疑產(chǎn)品。我現(xiàn)在遇到的一個(gè)問題是,用戶在問問題的時(shí)候,其實(shí)是有文字和語音交互的。語音有時(shí)識別不準(zhǔn)。如果跟大模型交互的話,識別不準(zhǔn)確時(shí),大模型還會根據(jù)上下文做一些推測。但是現(xiàn)在沒法借助大模型對TTS的上下文做判斷,以校正TTS。所以我想問一下,你們是否遇到這塊的問題,以及如何解決?

  國朝游:這都是一些非常實(shí)際的問題。首先,語音和OCR都是繞不開的問題。第一點(diǎn),其實(shí)在大模型時(shí)代出現(xiàn)之前,語音的TTS的字準(zhǔn)率其實(shí)一直都有個(gè)上限。也肯定是有些辦法能夠提升的,這在行業(yè)內(nèi)也是比較公開的。

  另一方面,判斷它到底是什么。我們也發(fā)現(xiàn),它不一定每個(gè)字都識別得非常準(zhǔn)才能夠判斷。有些時(shí)候有一部分的詞可能不準(zhǔn),但整體連起來是能夠理解的。

  所以其實(shí)是從兩個(gè)方面解決,第一個(gè)方面就是怎樣讓它變得更準(zhǔn),第二方面就是本身讓模型去學(xué)習(xí)在不準(zhǔn)的情況下如何理解。

  提問3:您好,我是高途的AI教育的產(chǎn)品。我其實(shí)有點(diǎn)疑惑,在學(xué)習(xí)中,意圖的識別怎么做?因?yàn)椋鈭D識別非常困難。第二個(gè)問題是,在剛才您分享的那個(gè)案例課程里,根據(jù)學(xué)生回答,咱們這個(gè)模型好像是可以識別出學(xué)生哪個(gè)知識點(diǎn)沒有回答對,并且針對這個(gè)知識點(diǎn),給他做一個(gè)啟發(fā)式的教學(xué)。那怎樣在這個(gè)過程中精準(zhǔn)地找到哪個(gè)知識點(diǎn)不對?因?yàn)楝F(xiàn)在很多教育公司做的方式是你這個(gè)問題答錯(cuò)了,我根據(jù)這個(gè)答案反過來去告訴你這個(gè)過程應(yīng)該是怎么做的,最后就把所有的知識點(diǎn)1、2、3地列出來,那您是怎么實(shí)現(xiàn)在這個(gè)過程中直接精準(zhǔn)地找到學(xué)生哪個(gè)知識點(diǎn)有問題呢?

  國朝游:關(guān)于知識點(diǎn)這一塊,首先,我們內(nèi)部其實(shí)有非常多的老師講題、上課的數(shù)據(jù)。其實(shí)在這個(gè)方面,結(jié)合他們那些和我們的數(shù)據(jù)的標(biāo)注,我們能夠讓模型去學(xué)習(xí)到學(xué)生這樣的反饋代表他背后是什么狀態(tài),知識點(diǎn)掌握得怎么樣。所以這一塊其實(shí)也是通過大量的學(xué)習(xí)逐步實(shí)現(xiàn)的。

  關(guān)于學(xué)生的意圖,如果對比真人老師的話,首先最基本就是他問了一些問題后,學(xué)生說了什么內(nèi)容,這是靠語音識別學(xué)生意圖。其次,如果是真人場景的話,可能還有別的輔助識別意圖的方式,比如觀察學(xué)生的表情,看學(xué)生是不是反應(yīng)時(shí)間很長甚至是不回應(yīng)。你能采集到什么樣的數(shù)據(jù),就決定了你用哪些東西綜合判斷他的意圖是什么。

  核心取決于怎樣在不影響用戶參與學(xué)習(xí)和答疑的過程的前提下,采集到盡量多的數(shù)據(jù),就可以把這些數(shù)據(jù)利用起來,分析他的意圖是什么。

  提問4:我想問的是,怎么讓這個(gè)模型能夠基于答案解析,把這個(gè)解析拆成一個(gè)一個(gè)的步驟,還原到老師解題的過程,再用大模型跟學(xué)生引導(dǎo)式的互動,幫學(xué)生把這道題解出來。比如學(xué)而思有很多課程,有很多講題視頻,能夠給到模型去學(xué)習(xí),這里面可能也需要老師的一些標(biāo)注的數(shù)據(jù),我非常好奇,怎樣把老師的思路給到模型,讓模型去學(xué)習(xí)老師的講題思路,怎樣評價(jià)這個(gè)模型的效果?

  國朝游:關(guān)于怎樣把老師的這個(gè)思路給到模型,目前,我們通過一些高質(zhì)量的數(shù)據(jù)給到模型,讓模型去學(xué)。其實(shí)這個(gè)問題就變成了怎樣拿到這些數(shù)據(jù),那我們自己有很多的優(yōu)質(zhì)教研資源,比如題庫,比如講題視頻。另一個(gè)方式是,也有一部分可能質(zhì)量并沒有達(dá)到要求的數(shù)據(jù),那就依靠標(biāo)注。我們也投入了很多的資源在標(biāo)注這一塊。第三個(gè)方式是,用AI生產(chǎn)數(shù)據(jù)。AI生產(chǎn)數(shù)據(jù)的量是很大的,但問題是AI生產(chǎn)的數(shù)據(jù)質(zhì)量到底行不行,能不能用于重新訓(xùn)練。這是一個(gè)非常大的難點(diǎn)要去解決。但是如果你沒有前面那兩種方式,只是用AI生成數(shù)據(jù)去訓(xùn)練模型,大概率最后是不可行的。