10月8號(hào),禮拜一上午九點(diǎn),中海理工大綜合實(shí)驗(yàn)大樓自然語(yǔ)言識(shí)別研究所。
和煦的陽(yáng)光穿過(guò)紗窗照射在檀木色辦公桌說(shuō),留下一塊塊明暗交替的光斑,戴著老花鏡的唐天華教授正手持鋼筆修改材料。
就在這時(shí),辦公室門(mén)被人“咚咚咚”的敲響了。
“進(jìn)來(lái)。”
門(mén)“咔噠”一聲被人從外面擰開(kāi),唐教授下意識(shí)看過(guò)去,等見(jiàn)到進(jìn)來(lái)的人后,那張不茍言笑的臉上卻是露出了笑容。
進(jìn)來(lái)的人自然便是陳序了,走到辦公桌前面有些局促的喊道:“老師好!”
唐教授笑著伸手示意了一下說(shuō):“坐下說(shuō)。”
陳序走到墻根便的實(shí)木椅旁坐下。
唐教授挪動(dòng)了一下身體,靠在椅背上慈眉善目的笑問(wèn)道:“怎么樣,有沒(méi)有決定好研究方向?”
說(shuō)實(shí)話,唐教授也對(duì)陳序的功課進(jìn)行了一番了解,在看到那些連優(yōu)秀都稱(chēng)不上的成績(jī)單時(shí),心里是有些動(dòng)搖的,想著是不是再觀察觀察?
不過(guò)那篇讓他為之驚艷的論文時(shí),所有疑慮都打消了。
這是一個(gè)在自然語(yǔ)言處理方面非常有天賦的年輕人,他打算好好培養(yǎng)一番。
陳序撓撓頭說(shuō):“呃……詞法與句法分析。”
聽(tīng)到陳序的選擇,唐教授皺了皺眉頭。
從那篇《自然語(yǔ)言處理的前瞻》里就能看出來(lái),這是一個(gè)有著勃勃野心的年輕人,他想挑戰(zhàn)當(dāng)今世界自然語(yǔ)言處理中最核心的難題也在情理之中。
不過(guò)嘛……
唐教授說(shuō):“你要想清楚了,一旦選錯(cuò)方向,可能會(huì)走上很多彎路,浪費(fèi)時(shí)間浪費(fèi)精力,你確定要選擇詞法與句法分析?”
面前唐教授勸解的話語(yǔ),陳序堅(jiān)定的點(diǎn)點(diǎn)頭,“我確定。”
燕京HD區(qū)中關(guān)村科學(xué)院南路6號(hào),這里是“中國(guó)計(jì)算機(jī)協(xié)會(huì)”的總部,同時(shí)也是國(guó)內(nèi)最頂尖的計(jì)算機(jī)期刊《計(jì)算機(jī)科學(xué)技術(shù)學(xué)報(bào)》、英文名JCST的辦公地點(diǎn)。
上午9點(diǎn),劉成林教授來(lái)到協(xié)會(huì)處理一些公務(wù)。
劉成林不僅是中國(guó)計(jì)算機(jī)協(xié)會(huì)的副會(huì)長(zhǎng)、JSCT國(guó)內(nèi)總負(fù)責(zé)人、國(guó)內(nèi)語(yǔ)音識(shí)別方面的權(quán)威教授,同時(shí)也是青木大學(xué)的博導(dǎo)。
10點(diǎn)半,劉成林在處理完國(guó)慶期間積壓下來(lái)的公務(wù)后,來(lái)到自己辦公室稍作休息,等下便準(zhǔn)備下樓吃午飯。
走到辦公桌前瞄了眼案頭,果然又是厚厚一摞的論文稿子。
對(duì)此劉成林已經(jīng)習(xí)慣了。
現(xiàn)在人工智能是計(jì)算機(jī)熱門(mén)專(zhuān)業(yè),而語(yǔ)音識(shí)別又是熱門(mén)里的熱門(mén),全國(guó)那么多高校,可以想象從事相關(guān)方面研究的人何其多?
他作為這方面的權(quán)威專(zhuān)家教授,每天要收到很多幫忙審稿的請(qǐng)托。都是一些學(xué)術(shù)界同仁好友的學(xué)生后輩之類(lèi)的。
趁著吃午飯前的片刻功夫,劉成林想看看這些論文里有沒(méi)有什么新穎的思路。
拿起第一份,題目是《Development of Multi-Person Speech Recognition Software for Mobile Phone Based on Android System(基于Android系統(tǒng)的手機(jī)多人語(yǔ)音識(shí)別軟件開(kāi)發(fā))》。
翻開(kāi)隨便看了看,沒(méi)有新意,沒(méi)有亮點(diǎn),對(duì)現(xiàn)有語(yǔ)音識(shí)別技術(shù)的提升沒(méi)有任何幫助,唯一值得肯定的就是還算嚴(yán)密的算法結(jié)構(gòu)。
劉成林搖搖頭,把這篇論文放到了一邊,拿起下一本,《Speech Recognition Based on Deep Learning and Its Application(基于深度學(xué)習(xí)的語(yǔ)音識(shí)別及其應(yīng)用研究)》
順手翻開(kāi)看了看,還不如上一篇呢,都是一些炒冷飯的東西,甚至連語(yǔ)言表述都有些顛三倒四,不知道這樣的論文怎么就敢拿給他審閱的。
“這都是些什么人啊!”劉成林有些生氣,順手把論文扔到辦公桌上。
想了想他又拿起論文看了看第二作者,發(fā)現(xiàn)是在一個(gè)國(guó)際學(xué)術(shù)會(huì)議上認(rèn)識(shí)的國(guó)內(nèi)某二流大學(xué)教授。
劉成林搖搖頭,拿起紅筆在論文上面畫(huà)了個(gè)×,然后又在×外面畫(huà)了個(gè)圈,表示退稿并且不再接收。
平息了一下心情,劉成林伸手從案頭上又拿了份論文。
讓他沒(méi)想到的是,這份論文竟然非常厚,粗略估測(cè)起碼有一百頁(yè)。
“嚯~好家伙。”劉成林托起論文湊到眼前看了看題目,終于不再是“基于某某某”了,而是《自然語(yǔ)言處理的前瞻》。
“喲,口氣不小嘛!”
看到這個(gè)題目,劉成林和唐天華的反應(yīng)差不多,第一時(shí)間就想笑,再加上這么厚厚一摞,他懷疑這個(gè)作者怕不是把論文當(dāng)小說(shuō)寫(xiě)了吧。
看了眼論文題目后面的作者名,第一作者不認(rèn)識(shí),第二作者名字叫唐天華。
劉成林楞了一下才想起來(lái)唐天華是誰(shuí)。
雙方是在國(guó)內(nèi)的一次專(zhuān)家會(huì)議上認(rèn)識(shí)的,印象中這個(gè)唐天華在語(yǔ)言識(shí)別方面頗有建樹(shù),算是少見(jiàn)的實(shí)干型人才。
不過(guò)對(duì)唐天華的好印象,并不能改變劉成林連翻開(kāi)論文看一眼的欲望都沒(méi)有的心情。
勉強(qiáng)翻開(kāi)第一頁(yè)。
【摘要:在確定國(guó)際自然語(yǔ)言處理領(lǐng)域使用頻率最高的97個(gè)關(guān)鍵詞的基礎(chǔ)上,運(yùn)用共詞分析法,以SPSS數(shù)據(jù)分析軟件為工具,通過(guò)因子分析和聚類(lèi)分析的方法,并借鑒最新研究成果,探討國(guó)際自然語(yǔ)言處理現(xiàn)狀以及未來(lái)發(fā)展】
四平八穩(wěn)的開(kāi)頭雖然沒(méi)有讓劉成林有眼前一亮的感覺(jué),但也對(duì)對(duì)方接下來(lái)的所要論述的內(nèi)容產(chǎn)生的好奇感,想看看對(duì)方到底怎么“編”?
不過(guò)劉成林的想法很快便消失了。
這個(gè)論文作者不僅沒(méi)有“編”,而且一切都在用國(guó)際最權(quán)威的數(shù)據(jù)說(shuō)話。
從自然語(yǔ)言處理中的最基本也是最重要的詞法、語(yǔ)法、語(yǔ)義開(kāi)始說(shuō)起,層層推進(jìn),步步為營(yíng),用最簡(jiǎn)單、最樸實(shí)無(wú)華的語(yǔ)句來(lái)告訴讀者,什么是詞法、語(yǔ)法、語(yǔ)義分析?
現(xiàn)在國(guó)際最頂級(jí)的大咖研究到了哪里?
他們遇到了哪些問(wèn)題?
如果你要從事這方面的研究,你應(yīng)該從何入手?
看完第一段之后,劉成林有些驚嘆。
這個(gè)作者的論文思路清晰、語(yǔ)句通順、層次分明,觀點(diǎn)表達(dá)精確,敘述風(fēng)格已經(jīng)到了返璞歸真的地步了,他已經(jīng)很久很久沒(méi)有看到過(guò)這樣精彩的科普性論文了。
更重要的是,對(duì)方在自然語(yǔ)言處理方面,有著扎實(shí)的基礎(chǔ),這是一般人做不到的。
劉成林忍不住合起論文看了眼名字:陳序。
然后劉成林翻開(kāi)論文繼續(xù)朝下面看……
……
從綜合實(shí)驗(yàn)大樓回來(lái)后,陳序便忙碌了起來(lái)。
把市面上有關(guān)于詞法、語(yǔ)法、語(yǔ)義分析方面書(shū)籍統(tǒng)統(tǒng)收集回來(lái),然后逐一錄入到小白的資料庫(kù)當(dāng)中。
小白是強(qiáng)大,不需要告訴它什么是分詞,詞性,詞的顆粒度,詞所在語(yǔ)句的位置,同義詞,轉(zhuǎn)意詞等等等等。
但是,未來(lái)基于自然語(yǔ)言處理開(kāi)發(fā)出來(lái)的翻譯軟件/機(jī)器,那是要投入到商業(yè)應(yīng)用當(dāng)中去的,不可能讓小白充當(dāng)智腦來(lái)翻譯,這也不現(xiàn)實(shí)。
所以還是要攻克自然語(yǔ)言處理當(dāng)中的難題。
比如,怎么樣才能讓機(jī)器理解人類(lèi)基于情感式的、模糊的語(yǔ)義表達(dá)?
這需要小白在當(dāng)今自然語(yǔ)言處理的研究基礎(chǔ)上,不停的進(jìn)行推演,破解掉詞法、語(yǔ)法、語(yǔ)義分析的終極密碼。
到時(shí)候再進(jìn)行句法分析、篇章分析、建立語(yǔ)言認(rèn)知模型等等,會(huì)易如反掌,整個(gè)自然語(yǔ)言處理中的難題會(huì)如同多米諾骨牌一樣轟然倒地。
而他作為小白的“人生導(dǎo)師”,需要引領(lǐng)小白朝某這個(gè)方向努力前進(jìn),就像之前不停地填充寫(xiě)作素材庫(kù)一樣。
另外,未來(lái)軟件開(kāi)發(fā)出來(lái),他要作為“開(kāi)發(fā)者”和來(lái)自世界各地的專(zhuān)家學(xué)者進(jìn)行交流的,如果連技術(shù)的基本原理都不懂,那也太不像話了。
所以在小白學(xué)習(xí)的同時(shí),陳序也從人工智能方面的科普性書(shū)籍讀起,目的是為了幫助小白更好的成長(zhǎng)……