中國人工智能正在被“卡脖子”


  中國人工智能正在被“卡脖子”

 中國人工智能正在被“卡脖子”

  “中國有多少數(shù)學家投入到人工智能的基礎算法研究中?”五一前上海召開院士沙龍活動,中國工程院院士徐匡迪等多位院士的發(fā)問引發(fā)業(yè)界共鳴,被稱為“徐匡迪之問”。這一對當下中國人工智能直擊核心的提問,不但表明了當下中國人工智能發(fā)展的短板,同時也揭去了披在當下所謂“人工智能”算法外表華麗的面紗。

 中國人工智能正在被“卡脖子”

  “我國人工智能領域真正搞算法的科學家鳳毛麟角。”4月28日超聲大數(shù)據(jù)與人工智能應用與推廣大會,東南大學生物科學與醫(yī)學工程學院教授萬遂人表示,“徐匡迪之問”直擊我國人工智能發(fā)展的核心關鍵問題,“如果這種情況不改變,我國人工智能應用很難走向深入、也很難獲得重大成果”。

 中國人工智能正在被“卡脖子”

  人工智能是計算機技術發(fā)展到高級階段,融合了數(shù)學、統(tǒng)計學、概率、邏輯、倫理等多學科于一身的復雜系統(tǒng)。是當下所有信息技術所不能達到的高級應用。其最為核心的技術便是人工智能算法。如何讓計算機能像人類一樣進行思考,如同人一樣利用現(xiàn)有的知識進行學習并實現(xiàn)合乎邏輯的推理,是人工智能算法試圖實現(xiàn)的目標。其技術絕不是一般公司能夠輕輕松松實現(xiàn)的。當下國際社會公認的人工智能研發(fā)頂尖公司,如Google和IBM等投入了海量資源,動用了頂尖的數(shù)學科學家、計算機專家,能實現(xiàn)了計算機程序的一定程度智能化,但距離真正的AI仍然相差很遠。

  進入2021年,中國人工智能產(chǎn)業(yè)“忽如一夜春風來,千樹萬樹梨花開”,一下子出現(xiàn)了無數(shù)人工智能研發(fā)公司,并都號稱到得了顯著技術進步。比如基于人工智能的醫(yī)學圖像識別系統(tǒng),對于某個疾病的識別率高達95%以上,遠遠高于人工判讀。中國人工智能真的如此繁榮嗎?

  1/ 中國人工智能產(chǎn)業(yè)界研發(fā)現(xiàn)狀

  某業(yè)內(nèi)人士了解過國內(nèi)某大型互聯(lián)網(wǎng)企業(yè)制作的人工智能應用。其定位于利用AI程序判讀CT圖像,利用算法實現(xiàn)對病灶的判讀,提高醫(yī)生的效率并降低負擔。

  當問到其核心的人工智能算法的時候,企業(yè)倒也是直言不諱,其核心技術是使用了國際上開源的人工智能算法。在被引入后進行針對特定目的進行了二次開發(fā),并最后整體打包成為一套完整的人工智能應用。正是因為使用了開源的人工智能算法,才出現(xiàn)了許多應用明顯能力不足的情況。

  比如其無法提供一套大一統(tǒng)的應用。公司一共向我們展了大約六種疾病的診斷應用。不同的疾病需要使用對應的AI程序才可以得出相對準確的結果。如果將A疾病的算法使用到B疾病上,完全無法正常工作。就我淺薄的理解,真正人工智能的算法并不應當如此。它應當是一套通用的算法,既可以用于A疾病的診斷,同樣也可以用于B疾病。我們需要做的是提供大量疾病案例供AI學習訓練,隨著訓練樣本數(shù)量的增加,會使人工智能模型被訓練的越來越準確。但是這種一個疾病一個AI的方式還是頭一次聽說。好比一個醫(yī)生只能看男性長胡子的感冒患者,如果是個不沒長胡子的男患者,只能去隔壁就醫(yī)了。

  浙江大學應用數(shù)學研究所所長孔德興教授清清楚楚說明白了這個問題。因為公司使用的都是開源算法。開源人工智能算法能力是不足的,根本無法實現(xiàn)預期的能力。人工智能算法堪稱信息行業(yè)的核武器。如此威力龐大的算法怎么樣可會在網(wǎng)上被開源出來?可以認為開源的人工智能算法相當于玩具水平的東西。想借助這種低水平的算法,來實現(xiàn)真正的人工智能應用怎么可能實現(xiàn)呢?

  開源算法唯一好處在于人人都可獲得,門檻非常低。所以大量公司從網(wǎng)上下載了開源算法,然后以其為核心研發(fā)出一套AI應用,再披上華麗的面紗,唬的普通用戶奉若神明。這也在突然間中國出現(xiàn)了如此多的人工智能公司的原因之一吧。

  真正人工智能的到來還需要很長時間,絕不是借助網(wǎng)上共享了的代碼就能夠?qū)崿F(xiàn)的,必須要腳踏實地,一步一個腳印地開發(fā)出來,不付出努力想投機取巧是萬萬不能的。我國依靠開源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展?為什么要有自己的底層框架和核心算法?

  2/ 缺少核心算***被“卡脖子”

  “如果缺少核心算法,當碰到關鍵性問題時,還是會被人‘卡脖子’?!闭憬髮W應用數(shù)學研究所所長孔德興教授對科技日報記者表示,我國人工智能產(chǎn)業(yè)的創(chuàng)新能力并沒有傳說中的那樣強,事實是,產(chǎn)業(yè)發(fā)展過度依賴開源代碼和現(xiàn)有數(shù)學模型,真正屬于中國自己的東西并不多。

  4個月零基礎學會人工智能、16講入門人工智能、算法線下大課……類似培訓在網(wǎng)絡上非?;鸨?,通過對于現(xiàn)有算法、模型的學習和訓練,成長為人工智能工程師的“短平快”可見一斑。

  既然代碼是開源的,拿來用就好,為什么還有可能被“卡脖子”?

  孔德興解釋,開源代碼是可以拿過來使用,但專業(yè)性、針對性不夠,效果往往不能滿足具體任務的實際要求。以圖像識別為例,用開源代碼開發(fā)出的AI即使可以準確識別人臉,但在對醫(yī)學影像的識別上卻難以達到臨床要求。“例如對肝臟病灶的識別,由于邊界模糊、對比度低、器官黏連甚至重疊等困難,用開源代碼很難做到精準識別。在三維重構、可視化等方面難以做到精準反應真實的解剖信息,甚至會出現(xiàn)誤導等問題,這在醫(yī)學應用上是‘致命’的?!?/p>

  “碰到專業(yè)性高的研究任務,一旦被‘卡脖子’將會是非常被動的,所以一定要有自己的算法?!笨椎屡d說。換句話說,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算。用開源代碼“**”出的AI頂多是個“常人”,而要幫助AI成長為“細分領域?qū)<摇?,需以?shù)學為基礎的原始核心模型、代碼和框架創(chuàng)新。秦隴紀總結,中國制造正從“硬件組裝廠”向“軟件組裝廠”蔓延,浮躁如故。

  3/ 有算法之“根”才能撐起產(chǎn)業(yè)“繁茂”

  所謂“樹大根深”,人工智能的發(fā)展也是同樣道理,越在底層深深扎下根基,越能夠發(fā)展出強大的產(chǎn)業(yè)。那么,借助開源代碼,“半路出家”的AI產(chǎn)業(yè)為什么會難以為繼?

  孔德興解釋說,在獲得同樣數(shù)據(jù)的前提下,以開源代碼運行,AI深度學習之后或許能輸出結果,但由于訓練框架固定、算法限制,當用戶進行具體的實際應用時,將很難達到所期望的結果,而且難以修改、完善、優(yōu)化算法。

  “如果從底層算法做起,那么整個數(shù)學模型、整個算法設計、整個模擬訓練‘一脈相承’,不僅可以協(xié)同優(yōu)化,而且可以根據(jù)需求隨時修改,從而真正解決實際問題。”孔德興說,基礎算法往往是指研究共性問題的算法,它涉及到基礎數(shù)學理論、高性能數(shù)值計算等學科,可以應用到多種實際問題中;而針對性強的應用算法往往會應用到具體問題所涉及的“具體知識、先驗信息”,從而更好地解決實際應用問題。

  “基礎算法和應用算法都很重要,擁有基礎算法將更有助于應用算法的豐富與深入。”孔德興說,AI要應對的現(xiàn)實生活是復雜、多變的,當能夠“應對自如”時,才能夠促成產(chǎn)業(yè)的“繁茂”。

  4/ 呼吁三方協(xié)力讓數(shù)學不再置身事外

  “一方面是政策引導,其實國家已經(jīng)在加大這方面的扶持,例如科研基金上的設置等。” 針對如何解決“徐匡迪之問”反映出來的問題,孔德興認為,第二方面是行業(yè)企業(yè)在進行科技創(chuàng)新時,應有意識將數(shù)學學者納入進來?!叭绻ㄟ^算法的開發(fā),最終產(chǎn)品落地了,企業(yè)應該將算法開發(fā)時的數(shù)學學者納入到成果分享中來?!笨椎屡d說,社會目前對于數(shù)學科學等“軟實力”的認可程度不足,行業(yè)或法規(guī)層面應該做好數(shù)學研究成果的產(chǎn)權保護工作。

  “第三方面,數(shù)學家本身應該積極參與到人工智能發(fā)展的浪潮里?!笨椎屡d呼吁,AI的未來發(fā)展需要數(shù)學家深度參與。由于目前仍處于“弱人工智能”時代(可以說是數(shù)據(jù)智能時代),AI的實現(xiàn)主要是依賴計算機的巨大算力和巨大的存儲能力,底層算法的問題或許并不突出,但在未來的發(fā)展,AI將可能融入邏輯、思維等智慧的內(nèi)容,這些都需要數(shù)學科學的原始創(chuàng)新,有大量的基礎問題亟待數(shù)學家攻克。

  算法的進階一定是來源于“原創(chuàng)者”,而不是“跟隨者”??椎屡d說:“實際上深度學習的應用已遇到了天花板,我們需要新的數(shù)學技術(如部分依賴邏輯、部分依賴數(shù)據(jù)的‘聰明算法’),讓計算機變得聰明起來。這些工作都需要數(shù)學家的參與?!?采訪來源:科技日報)

  5/ 人工智能發(fā)展陷入了拿來主義怪圈

  歷史已經(jīng)證明,通過購買現(xiàn)成的產(chǎn)品與技術來實現(xiàn)技術的跨越,在科學技術領域是行不通的。中國科技行業(yè)的哪一樣,不都是經(jīng)歷了艱苦奮斗,無數(shù)科學家默默無聞為之奉獻后,方才得以傲視世界群雄?比如中國的量子技術,比如中國的國防科技,中國的天宮空間站,中國的嫦娥月球車。

  作為技術高度密集的人工智能技術,其商業(yè)領域竟然是陷入了拿來主義,著實讓人意外。中國AI產(chǎn)業(yè)大約從2021年開始一夜爆紅,稍微有些規(guī)模的IT廠家無不宣稱,已經(jīng)推出人工智能產(chǎn)品到市場上。當時認為這也是中國科學人多年來的厚積薄發(fā),技術積累到一定程度后實現(xiàn)了產(chǎn)業(yè)的繁榮??上У漠斝炜锏显菏堪l(fā)出直擊靈魂的提問后,才發(fā)現(xiàn)原來中國的AI產(chǎn)業(yè)不過是看上去很美麗。

  人工智能技術本質(zhì)上是以數(shù)學算法為核心,輔以計算機技術的產(chǎn)品。與其說是一個IT產(chǎn)品,倒不如說是一套數(shù)學理論,如隨機森林算法,貝葉斯算法等都是復雜的數(shù)學、統(tǒng)計學、概率領域的內(nèi)容。這些算法試圖通過數(shù)字概率來描述人類思考的過程。計算機技術不過是通過編程語言在信息系統(tǒng)中實現(xiàn)算法過程。可見推動人工智能前進的必定是數(shù)學領域的專家,而不是IT部門的人才。

  基礎學科,比如數(shù)學一直是我們非常薄弱的環(huán)節(jié)。當華羅庚將中國數(shù)學推向一個高峰后,之后眾人還只是在努力追趕國際同行,一直沒有能在國際上獨領風騷??上攵谌斯ぶ悄苌虡I(yè)、民用領域,我們的進展同國際同行相經(jīng)差距明顯。所以2021年的AI產(chǎn)業(yè)大爆發(fā)就讓人心生懷疑。

  沒有安心研發(fā),那么就拿現(xiàn)成的好了。正巧大家可以從網(wǎng)上下載到開源人工智能算法。于是大家都將其下載下來,加上漂亮的外殼,讓我們的AI產(chǎn)品炫酷奪目。如果有機會能探究當下較火的商業(yè)人工智能產(chǎn)品,最終會發(fā)現(xiàn)所有算法都指向了同一個來源。不是說開源不好,正如浙江大學孔德興教授所言,開源的產(chǎn)品是由其它國家人開發(fā)出來的,無論其功能好與壞,你并不知道它的開發(fā)思路是怎么樣的。算法高效之處不知為何,而其能力不足之處也茫然不知。盡管其是開放源代碼的,不知道有多少IT公司認認真真地研讀一遍將其吃透研究明白了。

  還有一點想跟大家討論的是,開源的人工智能算法絕不會是高效的,或者說是真正的算法程度。開源代碼是IT高手們將自己想法實現(xiàn)并放到網(wǎng)上供大家討論的東西,往往是初級的,探索性的東西。據(jù)說當現(xiàn)開源AI代碼是從印度工程師放出來的(這點也是聽聞,不確定)。現(xiàn)在大家應當有所體會,人工智能絕不會是一兩個工程師就可以搞出來的東西,要不為什么谷歌公司投入了那么多人力物力才實現(xiàn)了將國際象棋冠軍打敗的程度。而這套算法卻無法應對英國高中數(shù)學問題。還有一點,真正尖端的人工智能算法,永遠不會出現(xiàn)在互聯(lián)網(wǎng)上供人們共享的。

  資本的力量是可怕的。為了賺取利潤占領市場,商家秉持著唯快不破的想法,極速將產(chǎn)品推出來,哪有功夫去管它是好是壞呢??墒侨斯ぶ悄苁且婚T科學,是最為嚴謹?shù)臄?shù)學課題,不可能容得下這般不負責任的炒作。

  這個世界是公平的,你怎樣對待科學,它就會怎樣對待你。玩弄科學,炒作概念,不腳踏實地的鉆研反而投機取巧,必定會被其反噬。如果大家一直在追蹤AI發(fā)展情況,其實已經(jīng)可以感受到,AI的熱度較去年有所下降。而到現(xiàn)在為止尚未有一個真正能拿出手的商業(yè)人工智能產(chǎn)品在市場上出現(xiàn)。這已經(jīng)說明許多。

  愛之深恨之切。我們都期盼著中國IT有朝一日能夠站在世界巔峰。這個過程是需要腳踏實地的,一個臺階一個臺階攀登上去,沒有任何取巧的辦法。亡羊補牢未為晚也,希望徐匡迪之問能驚醒中國IT公司,扎扎實實的一步一個腳印的走下去,讓國人早日用上真正的人工智能應用。

  人工智能專業(yè)前景如何?

  極其好。如果說計算機專業(yè)是上個時代的老大,那么人工智能專業(yè)就是下個時代的龍頭。因為:

  1. 大數(shù)據(jù)、芯片計算能力、5G網(wǎng)絡的發(fā)展使得AI人工智能得以高速發(fā)展。目前在自動駕駛、智能家居、工業(yè)制造等很多領域,人工智能都在快速突破。例如預計5-10年后,美國有50%的車輛將是無人駕駛。

  2. 真正的人工智能公司發(fā)展?jié)摿艽螅? 人才更容易脫穎而出。如人工智能芯片公司“深鑒科技”,由四名清華高手僅僅創(chuàng)立2年后被收購,收購價3-4億美元。當然,該專業(yè)的工資也很高,真正的人工智能崗位年薪百萬比較容易。

  人工智能專業(yè)的要求高么?

  很高。該專業(yè)的前景有多好,對應的專業(yè)要求就有多高。 人工智能是計算機+數(shù)學建模的結合,該專業(yè)要求有極其好的數(shù)學邏輯能力,能把該專業(yè)真正學明白的估計沒多少人。 例如給你1萬張手機自拍人臉照片,讓你通過編程,建立一個數(shù)學模型識別出照片中哪些人臉是高興的表情。你需要把照片轉(zhuǎn)化為計算機可處理數(shù)據(jù),例如不同格式不同尺寸的圖片如何統(tǒng)一處理;你需要搭建模型來判斷數(shù)據(jù)有什么規(guī)律是表示高興,例如計算嘴角的弧度、眉頭的皺紋等等,同時要考慮不同年齡不同人種的臉部特點;模型要經(jīng)過大量訓練來優(yōu)化,這會需要大量的計算機處理能力(例如幾十臺服務器),需要設計優(yōu)秀的程序來保證訓練過程盡量減少計算機的消耗以及減少計算時間(如并行計算)。

  因此,基本是絕對的數(shù)學學霸可以真正搞定該專業(yè)。


網(wǎng)上報名
  • 姓名:
  • 專業(yè):
  • 層次: ??分數(shù):
  • 電話:
  • QQ/微信:
  • 地址:

文中圖片素材來源網(wǎng)絡,如有侵權請聯(lián)系644062549@qq.com刪除

轉(zhuǎn)載注明出處:http://www.tengyi66.com