機(jī)器人批改試卷:200字不到的作文看出8處錯誤—高考人工智能


一篇200字不到的作文,機(jī)器人用幾十秒時(shí)間找出了8處語法和用詞錯誤。最近,在浙江外國語學(xué)院國際學(xué)院,來自俄羅斯、韓國、贊比亞等6個國家的11位外國留學(xué)生完成了一份特別的中文試卷,他們成為了全球首批用人工智能(AI)來閱卷的學(xué)生...
 機(jī)器人批改試卷:200字不到的作文看出8處錯誤—高考人工智能

  一篇200字不到的作文,機(jī)器人用幾十秒時(shí)間找出了8處語法和用詞錯誤。最近,在浙江外國語學(xué)院國際學(xué)院,來自俄羅斯、韓國、贊比亞等6個國家的11位外國留學(xué)生完成了一份特別的中文試卷,他們成為了全球首批用人工智能(AI)來閱卷的學(xué)生。

 機(jī)器人批改試卷:200字不到的作文看出8處錯誤—高考人工智能

  在考試前,老師布置了一道名為“請寫一寫你的愛好”的命題作文。半個小時(shí)后,同學(xué)們陸續(xù)交卷。接下來這個閱卷機(jī)器人開始工作。

 機(jī)器人批改試卷:200字不到的作文看出8處錯誤—高考人工智能

  先將試卷掃描,在后臺圖像被轉(zhuǎn)化成文字出現(xiàn)在電腦上,幾十秒之后,迅速在一篇200字不到的作文里圈出了8個錯誤。

  這篇作文是這樣寫的:我的愛好是學(xué)中文,中文使我快樂。但中文的難點(diǎn)并非是字,而且像女朋友一樣善變。比如,我到中國才知道了大姨媽不是人。而且,有一次我問舍友去吃飯不去,他說:我去,我才不去。我的內(nèi)心是崩潰的。我問他“你這是什么意思?”他說:“沒什么意思,意思意思?!蔽沂艿搅松系鄣帽簟H欢?,我的不會放棄的。除非中國人也放棄我才會放棄。聽說這次的試卷是AI老師看的,如果他們會教給外國人學(xué)習(xí)中文是很好的消息。

  在這份試卷上,阿里AI用代表不同意義的符號在試卷上,圈出多詞(Redundant)、缺詞(Missing)、錯詞(Selection)和詞序錯誤(Word Order)等錯誤位置,完成了對作文的批改。

  比如AI認(rèn)為,“但中文的難點(diǎn)并非是字,而且像女朋友一樣善變”這句話里有兩個錯誤:“是”多用了,“而且”是錯詞。

  浙江外國語學(xué)院外語系李老師說:“我們希望科技能夠幫助外國留學(xué)生們理解中文。前兩天正好在報(bào)紙上看到,iDST人工智能在中文語法錯誤自動診斷大賽上奪得冠軍,我們就試著邀請這個‘AI老師’幫助外國留學(xué)生學(xué)中文。沒想到得到了回應(yīng)?!?/p>

  工程師透露,這款A(yù)I學(xué)習(xí)了幾十萬的中文語言體系,通過掃描儀讀取試卷信息,使用OCR技術(shù)將其轉(zhuǎn)換成文本,之后啟動自然語言處理算法進(jìn)行分析,并識別出錯位類型和位置,最后批注在試卷上。整個過程大概只需約5秒。從目前的測試情況來看,“AI老師”在準(zhǔn)確率和細(xì)致程度都是接近甚至超乎人類的水平。

  事實(shí)上,把AI應(yīng)用到外國人學(xué)中文試卷批改上,是全球首例。11月24日,iDST在中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱 CGED)三個level中全面奪得冠軍。

  CGED是自然語言處理領(lǐng)域的權(quán)威賽事。比賽的背景是:學(xué)習(xí)中文的外國人數(shù)不斷增加,由于中文的博大精深,外國友人在中文寫作中會出現(xiàn)各種錯誤。主辦方挑選了一些外國友人寫的中文作文片段,希望參賽者用人工智能算法自動識別里面的語法語義錯誤。

  iDST自然語言處理首席科學(xué)家司羅說,中文語法診斷的挑戰(zhàn)性在于,中文語言知識豐富、語法多樣;人在判斷一句話是否有錯誤的時(shí)候,會用到長期積累的知識體系(比如一句話是否通順、兩個詞是否可以搭配、語義上是否成立等)。相比之下,比賽提供的訓(xùn)練數(shù)據(jù)非常有限,僅通過訓(xùn)練數(shù)據(jù)來識別錯誤是很困難的。


網(wǎng)上報(bào)名
  • 姓名:
  • 專業(yè):
  • 層次: ??分?jǐn)?shù):
  • 電話:
  • QQ/微信:
  • 地址:

文中圖片素材來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系644062549@qq.com刪除

轉(zhuǎn)載注明出處:http://www.tengyi66.com