轉(zhuǎn)帖|行業(yè)資訊|編輯:鄭恭琳|2016-09-05 15:05:10.000|閱讀 290 次
概述:將自然語言處理(NLP)的先進(jìn)成果,從前沿研究的小世界里拿出來,送到普通的數(shù)據(jù)科學(xué)家和軟件工程師手中,這已經(jīng)成為一場運動。7月20日,谷歌也加入進(jìn)來,發(fā)布了測試版的云自然語言API。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
谷歌的NLP API讓用戶可以利用如下三個核心的NLP特性:
這些工具使用了谷歌的深度機(jī)器學(xué)習(xí)算法,這也是其API與其他自建的數(shù)據(jù)科學(xué)工具的不同之處。
NLP軟件是一種構(gòu)建用來理解人類語言或文本的程序。像谷歌和IBM這樣的科技巨頭發(fā)布了大量便于開發(fā)人員使用的API,讓這類軟件進(jìn)入了主流應(yīng)用。在谷歌的一篇博文中,開發(fā)工程師Sara Robinson使用該API的實體識別特性識別《哈利·波特》中的人物和地點(因為她不會念咒語)。接下來,她比較了自己開發(fā)并維護(hù)所有軟件和使用NLP API的差別:
『我可以編寫自己的算法,找出這個句子里的人物和地點,但是那會很困難。而且,考慮到相同的實體會使用不同的詞語描述,如果我希望針對涉及到的每個實體收集更多的數(shù)據(jù),或者在成千上萬的句子里分析實體,則會更加困難。』
按照Robinson的說法,從頭構(gòu)建NLP軟件特別困難,因為即使是在開始真正的工具開發(fā)工作之前,數(shù)據(jù)收集、預(yù)處理和訓(xùn)練就有太多的事項需要注意。像谷歌提供的這種NLP API,讓用戶可以利用NLP算法的強(qiáng)大功能,而又不必應(yīng)對復(fù)雜的高等數(shù)學(xué)計算、工程和數(shù)據(jù)建模所帶來的巨大開銷。
Watson的Conversation API也是最近出現(xiàn)的NLP API。借助該API,你可以使用NLP解釋不同的用戶指令,并將這些指令傳達(dá)給不同的智能家居軟件,比如控制燈光的應(yīng)用。Watson API有交互式的Swagger文檔,你可以在里面測試類似“開燈”和“天氣怎么樣”這樣的請求。谷歌的NLP API面向更為廣泛的NLP使用場景,而Watson的API主要是為人通過文本或語言同機(jī)器通信提供便利。它基于日益流行的IoT(物聯(lián)網(wǎng))技術(shù)構(gòu)建。在IoT環(huán)境里,NLP是同智能汽車、家居、甚至衛(wèi)生紙筒通信的理想介質(zhì)。
Facebook采取了一種更為直接的路線,即向更大的技術(shù)社區(qū)公布內(nèi)部使用的NLP代碼。今年7月,他們把詞匯表征學(xué)習(xí)和句子分類庫fastText的所有源代碼都發(fā)布在了GitHub上。雖然開發(fā)人員不會完全忠于一個干凈的API,但能夠從Facebook的代碼創(chuàng)建分支,讓開發(fā)人員可以在更高的層面上參與到現(xiàn)有的NLP數(shù)據(jù)科學(xué)社區(qū)。在社區(qū)環(huán)境里,這個庫很容易衍生出更多的NLP API和庫。無論形式如何,可以確定的是,NLP離普通大眾越來越近。
本文來源:
英文原文:
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn