作為與數(shù)據(jù)最為相關(guān)的領(lǐng)域之一,繼互聯(lián)網(wǎng)、物聯(lián)網(wǎng)之后,教育被視作大數(shù)據(jù)大有可為的重要行業(yè)。遍布教、學(xué)、研多層面的數(shù)據(jù)集合,通過(guò)有效利用大數(shù)據(jù)技術(shù),可幫助學(xué)生改善學(xué)習(xí)效率,提供符合職業(yè)規(guī)劃的個(gè)性化學(xué)習(xí)服務(wù),同時(shí)也有助于教育和科研機(jī)構(gòu)加快提升科研成果和教育質(zhì)量,培養(yǎng)更多更優(yōu)秀的創(chuàng)新性人才。
大數(shù)據(jù)時(shí)代教育迎新機(jī)遇
大數(shù)據(jù)時(shí)代,教育模式將加速轉(zhuǎn)型,一方面?zhèn)鹘y(tǒng)教育在朝著數(shù)字化教學(xué)過(guò)渡期間,也將逐步引入大數(shù)據(jù)分析技術(shù),更好地滿足人才培養(yǎng)、教育科研的需要;另一方面,不同區(qū)域社會(huì)經(jīng)濟(jì)發(fā)展帶來(lái)的教育差異性,可通過(guò)數(shù)據(jù)挖掘、教學(xué)案例結(jié)合本地產(chǎn)學(xué)結(jié)構(gòu),實(shí)現(xiàn)教育的“智慧化”。但無(wú)論何種情況,教育中的數(shù)據(jù)挖掘?qū)⒊蔀榇髷?shù)據(jù)分析的首要內(nèi)容。
教育機(jī)構(gòu)長(zhǎng)年積累的數(shù)據(jù)大部分為結(jié)構(gòu)化數(shù)據(jù),比如考試成績(jī)、出勤紀(jì)錄等,但近幾年興起的數(shù)字化學(xué)習(xí)、教學(xué)互動(dòng)等新型教學(xué)形式,通過(guò)智力輔導(dǎo)系統(tǒng)、個(gè)性化學(xué)習(xí)系統(tǒng)等產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù),為大數(shù)據(jù)時(shí)代教育行業(yè)的數(shù)據(jù)挖掘與分析奠定了基礎(chǔ)。
華為引領(lǐng)中國(guó)教育大數(shù)據(jù)應(yīng)用
就目前來(lái)說(shuō),教育行業(yè)通常采用的數(shù)據(jù)價(jià)值分析包括有預(yù)測(cè)、聚類、相關(guān)性挖掘、判斷、模式發(fā)現(xiàn),通過(guò)這些技術(shù)可利用大數(shù)據(jù)全面提升教育質(zhì)量和信息化水平。
在中國(guó),教育行業(yè)的大數(shù)據(jù)市場(chǎng)更為廣闊,中國(guó)擁有較大的人口基數(shù),同時(shí)隨著社會(huì)經(jīng)濟(jì)的發(fā)展,人們對(duì)教育的重視和投入也逐年加大。比如中國(guó)頂級(jí)高等教育學(xué)府清華大學(xué),承擔(dān)起國(guó)家下一代互聯(lián)網(wǎng)核心網(wǎng)國(guó)家工程實(shí)驗(yàn)室建設(shè)項(xiàng)目中的“下一代互聯(lián)網(wǎng)核心網(wǎng)運(yùn)行管理技術(shù)研發(fā)平臺(tái)測(cè)量系統(tǒng)”的建設(shè)內(nèi)容,并建成“綜合流量采集與分析系統(tǒng)”和“Netflow流采集與分析系統(tǒng)”。前者需存儲(chǔ)6小時(shí)長(zhǎng)度的全報(bào)文和24小時(shí)的分組頭數(shù)據(jù),最大滿足540TB;后者需支持25個(gè)核心節(jié)點(diǎn)的Netflow流數(shù)據(jù)的采集。采集系統(tǒng)、存儲(chǔ)系統(tǒng)、分析系統(tǒng)還需分層獨(dú)立構(gòu)建,并能夠滿足未來(lái)存儲(chǔ)容量和分析平臺(tái)升級(jí)的要求。
考慮到整體架構(gòu)的復(fù)雜性和平臺(tái)項(xiàng)目的長(zhǎng)期性,需要選用具備整體解決方案的大數(shù)據(jù)技術(shù)。最終,清華大學(xué)選擇了華為的計(jì)算和存儲(chǔ)等一攬子解決方案:
1、通過(guò)N8500集群NAS系統(tǒng)為Netflow流采集與分析系統(tǒng)提供CIFS/FTP業(yè)務(wù),保存Netflow文件數(shù)據(jù),實(shí)現(xiàn)25個(gè)POP站點(diǎn)流數(shù)據(jù)及清華站點(diǎn)流數(shù)據(jù)的集中存儲(chǔ)與共享;
2、采用40臺(tái)RH2288H機(jī)架服務(wù)器為綜合流量采集與分析提供存儲(chǔ)和分析平臺(tái),并為后續(xù)Hadoop平臺(tái)的建立奠定基礎(chǔ)。
華為高性能RH2288H服務(wù)器,通過(guò)創(chuàng)新架構(gòu)和高效設(shè)計(jì),實(shí)現(xiàn)I/O模塊化靈活配置和熱插拔,在滿足高可靠性、高可用的同時(shí),可確保最優(yōu)的計(jì)算性能和擴(kuò)展能力,為后續(xù)的Hadoop大數(shù)據(jù)平臺(tái)的部署和應(yīng)用提供廣闊空間。除了支撐改平臺(tái)的RH2288H服務(wù)器以外,華為業(yè)內(nèi)首創(chuàng)推出的深度融合刀片服務(wù)器E9000,集計(jì)算、存儲(chǔ)、交換、管理于一體,可大幅簡(jiǎn)化機(jī)房部署、提升運(yùn)維效率。通過(guò)業(yè)內(nèi)領(lǐng)先的計(jì)算、存儲(chǔ)密度和能效,還可實(shí)現(xiàn)IT成本的顯著節(jié)省。
紅花還需綠葉襯大數(shù)據(jù)技術(shù)先行
清華大學(xué)承擔(dān)的國(guó)家工程試驗(yàn)平臺(tái),其目的就是為了針對(duì)下一代互聯(lián)網(wǎng)的發(fā)展需求,建立核心網(wǎng)技術(shù)研發(fā)、測(cè)試和試驗(yàn)平臺(tái),開展關(guān)鍵技術(shù)以及運(yùn)營(yíng)管理技術(shù)研究,推動(dòng)下一代互聯(lián)網(wǎng)技術(shù)試驗(yàn)、應(yīng)用示范和產(chǎn)品開發(fā),提高我國(guó)下一代互聯(lián)網(wǎng)核心網(wǎng)的運(yùn)行和管理技術(shù)水平。實(shí)驗(yàn)室建設(shè)將緊密圍繞信息化發(fā)展需要,提高下一代互聯(lián)網(wǎng)領(lǐng)域的自主創(chuàng)新能力,完成國(guó)家有關(guān)部門委托的科研課題,開展相關(guān)產(chǎn)業(yè)關(guān)鍵技術(shù)攻關(guān)、重要技術(shù)標(biāo)準(zhǔn)研究制訂,凝聚、培養(yǎng)產(chǎn)業(yè)急需的技術(shù)創(chuàng)新人才。
從某種程度上來(lái)說(shuō),教育大數(shù)據(jù)的應(yīng)用需要長(zhǎng)遠(yuǎn)規(guī)劃,并通過(guò)早期試點(diǎn)形成規(guī)模效益。在助力清華大學(xué)國(guó)家工程試驗(yàn)平臺(tái)項(xiàng)目上,華為深厚的技術(shù)底蘊(yùn)和卓越的產(chǎn)品與解決方案,幫助實(shí)現(xiàn)了25個(gè)POP站點(diǎn)及清華站點(diǎn)流數(shù)據(jù)的集中存儲(chǔ)和共享,并為分光數(shù)據(jù)采集系統(tǒng)提供存儲(chǔ)和分析平臺(tái),有利于后續(xù)Hadoop大數(shù)據(jù)平臺(tái)的設(shè)立和應(yīng)用。