簡(jiǎn)單總結(jié)李彥宏的演講:
他認(rèn)為,移動(dòng)互聯(lián)網(wǎng)之后人工智能是百度的核心。三年前的“百度大腦”就已經(jīng)具備了兩三歲孩子的智力水平。百度今天同時(shí)擁有超大規(guī)模的計(jì)算資源、中國(guó)最大的GPU集群以及國(guó)內(nèi)最為豐富(如果不是之一的話)的搜索、圖像、視頻、定位數(shù)據(jù),百度今天的“大腦”已經(jīng)成長(zhǎng)到什么水平?
以下是李彥宏的演講實(shí)錄全文:

在這之前,互聯(lián)網(wǎng)的發(fā)展已經(jīng)經(jīng)過(guò)兩個(gè)重要階段,也就是PC互聯(lián)網(wǎng)階段;第二個(gè)是最近四五年移動(dòng)互聯(lián)網(wǎng)階段。中國(guó)7億網(wǎng)民都用上了智能手機(jī),上網(wǎng)人口滲透率已經(jīng)超過(guò)50%。互聯(lián)網(wǎng)的發(fā)展已經(jīng)不能靠人口紅利來(lái)驅(qū)動(dòng)了。
當(dāng)前,中國(guó)進(jìn)入到經(jīng)濟(jì)的新常態(tài),國(guó)家也提倡互聯(lián)網(wǎng)+,實(shí)際上是希望我們用互聯(lián)網(wǎng)的效率來(lái)推動(dòng)行業(yè)的發(fā)展。整個(gè)中國(guó)的經(jīng)濟(jì)增長(zhǎng)需要依靠互聯(lián)網(wǎng),但是互聯(lián)網(wǎng)的增長(zhǎng)卻遇到了瓶頸,過(guò)去粗放式的野蠻增長(zhǎng)沒(méi)有了,互聯(lián)網(wǎng)行業(yè)從業(yè)者感受到深深的危機(jī)。
移動(dòng)互聯(lián)網(wǎng)的下一幕,是人工智能。對(duì)于百度來(lái)說(shuō)這是核心中的核心,過(guò)去百度投了很大的研發(fā)精力。對(duì)于百度來(lái)說(shuō)意味著什么?用四個(gè)字形容就是百度大腦,三年前,百度就講過(guò)“百度大腦”這個(gè)概念。那個(gè)時(shí)候的百度大腦已經(jīng)具備了大概兩三歲孩子的智力水平。
今天很多人問(wèn)我,百度大腦相當(dāng)于多少歲的人腦呢?回答這個(gè)問(wèn)題還蠻難的。百度大腦和人腦的正常發(fā)育過(guò)程很不一樣。
百度大腦包括三個(gè)部分:計(jì)算方法,包括超大規(guī)模的神經(jīng)網(wǎng)絡(luò)、萬(wàn)億級(jí)的參數(shù)、千億樣本和千億特征訓(xùn)練;計(jì)算能力,包括數(shù)十萬(wàn)臺(tái)服務(wù)器構(gòu)成了“百度大腦”的實(shí)體,幾年前百度便開(kāi)始自建中國(guó)最大的GPU集群,不是傳統(tǒng)基于CPU的服務(wù)器,而是GPU,GPU早年在游戲領(lǐng)域使用廣泛,適用于深度計(jì)算;數(shù)據(jù),全網(wǎng)的網(wǎng)頁(yè)數(shù)據(jù)、十多年來(lái)累積的搜索數(shù)據(jù),以及百億級(jí)的圖像、視頻、定位數(shù)據(jù)。這樣,百度大腦就可以開(kāi)始工作了。
百度大腦有哪些能力?四個(gè)能力,語(yǔ)音、圖像、自然語(yǔ)言理解和用戶畫像。
第一個(gè)語(yǔ)音已經(jīng)進(jìn)入相對(duì)成熟的階段。
百度大腦的語(yǔ)音識(shí)別已經(jīng)到了第二代,使用深度學(xué)習(xí)的技術(shù)進(jìn)行語(yǔ)音識(shí)別。百度語(yǔ)音識(shí)別的準(zhǔn)確率能夠達(dá)到97%,已經(jīng)超過(guò)了人對(duì)語(yǔ)音的識(shí)別能力。
這樣的能力到底可以在什么地方幫助到我們?舉個(gè)例子,很多公司都有自己的電話銷售部門,這個(gè)行業(yè)人員流動(dòng)性很大,而銷售人員需要長(zhǎng)時(shí)間培訓(xùn)才能上崗。即使是經(jīng)過(guò)培訓(xùn),甚至有一定經(jīng)驗(yàn)的銷售人員,每個(gè)人銷售效率也是參差不齊的。但是通過(guò)百度語(yǔ)音識(shí)別能力,一個(gè)新的銷售上崗的第一天,就可能掌握他所獲得的最優(yōu)秀的銷售能力:
新銷售打電話給潛在客戶的時(shí)候,客戶每說(shuō)一句話,客戶每問(wèn)一個(gè)問(wèn)題,百度大腦都實(shí)時(shí)地識(shí)別了問(wèn)題,并且顯示在銷售的電腦的屏幕上,屏幕上不僅實(shí)時(shí)展示了客戶的問(wèn)題,而且實(shí)時(shí)地把最優(yōu)秀的銷售是怎么回答這個(gè)客戶的問(wèn)題也展示在這個(gè)屏幕上。這樣,新的銷售的工作就簡(jiǎn)單多了,其實(shí)他基本上可以照著屏幕念,就能夠達(dá)到最優(yōu)秀的銷售的話術(shù)水平。
語(yǔ)音識(shí)別還有很多應(yīng)用場(chǎng)景,大家可以根據(jù)自己的行業(yè)背景去想象。
語(yǔ)音能力分為兩個(gè)方向,語(yǔ)音合成和語(yǔ)音識(shí)別。
語(yǔ)音合成是把文字轉(zhuǎn)換成語(yǔ)音,用自然人的聲音讀出來(lái),而不是以前的勻速無(wú)表情的語(yǔ)音。目前,百度每天響應(yīng)的語(yǔ)音合成的請(qǐng)求達(dá)到了2.5億次。在情感語(yǔ)音合成技術(shù)上線后,用語(yǔ)音聽(tīng)小說(shuō)的百度用戶從過(guò)去平均每天聽(tīng)0.69小時(shí),增長(zhǎng)到現(xiàn)在的2.21小時(shí)。
今天,語(yǔ)音合成還可以根據(jù)個(gè)人需求進(jìn)行定制,形成自然發(fā)聲的能力,模擬任何一個(gè)你喜歡的人的說(shuō)話方式。百度地圖中有一個(gè)李彥宏導(dǎo)航語(yǔ)音包,其實(shí)我并沒(méi)有說(shuō)過(guò)那些話,就是根據(jù)我日常的語(yǔ)音合成的。
我們現(xiàn)場(chǎng)合成一下13年前去世的張國(guó)榮的聲音。合成張國(guó)榮的聲音比較難,國(guó)語(yǔ)的語(yǔ)調(diào)比較少。以張國(guó)榮在影視、電臺(tái)等留存下來(lái)的原聲進(jìn)行建模,通過(guò)情感語(yǔ)音合成技術(shù)實(shí)現(xiàn)合成。
任何一個(gè)人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語(yǔ)音合成技術(shù)模擬出來(lái)這個(gè)人的聲音。人人都可以擁有自己的聲音模型。
第二個(gè)圖像識(shí)別能力是如何實(shí)現(xiàn)的?
從技術(shù)的角度講,它是通過(guò)對(duì)人臉特征的關(guān)鍵點(diǎn)的提取,找到了其中最不一樣的地方,構(gòu)成了一個(gè)面部的表情。當(dāng)一個(gè)人表情發(fā)生變化的時(shí)候,他的表情特征并不會(huì)發(fā)生改變。
除了人臉識(shí)別之外,百度在其他場(chǎng)景中也經(jīng)常會(huì)遇到圖像識(shí)別需求。計(jì)算機(jī)視覺(jué)或者圖像識(shí)別技術(shù)是無(wú)人車的最后一公里。過(guò)去一年,百度花了不少精力提升百度無(wú)人車在城市道路的運(yùn)行水平。百度無(wú)人車在行駛過(guò)程中,通過(guò)感知,可以探測(cè)到路面上車、路標(biāo)以及各種各樣的障礙物,每個(gè)物體有一個(gè)獨(dú)特的編號(hào),便于車對(duì)它進(jìn)行識(shí)別。這個(gè)車的識(shí)別是通過(guò)百度大腦來(lái)識(shí)別的。今年8月份KITTI評(píng)測(cè)的最新成績(jī)顯示,百度無(wú)人車在車輛檢測(cè)中排名第一,車輛跟蹤6項(xiàng)指標(biāo)中取得4項(xiàng)第一。
下一個(gè)是增強(qiáng)現(xiàn)實(shí),廣告主可以把現(xiàn)實(shí)產(chǎn)品和希望展示的場(chǎng)景聯(lián)系起來(lái)展示給消費(fèi)者。歐萊雅與百度合作,拍洗發(fā)水就可以準(zhǔn)確識(shí)別并和用戶互動(dòng)。
第三種是自然語(yǔ)言處理能力,目前發(fā)展程度不如圖像識(shí)別。
去年在百度世界大會(huì)上推出的度秘,是個(gè)人智能助理。現(xiàn)在度秘和用戶進(jìn)行溝通的方式和傳統(tǒng)的搜索已經(jīng)很不一樣了,有56%是通過(guò)語(yǔ)音或者圖像來(lái)完成的,語(yǔ)音和圖像的交互正逐步超越傳統(tǒng)文字的使用頻次,成為人們表達(dá)需求的主流方式。
除此之外,更核心的技術(shù)是用人的語(yǔ)音進(jìn)行交流,雖然不是每一次度秘都能理解。今年奧運(yùn)期間,百度機(jī)器人度秘搭檔知名解說(shuō)員楊毅,進(jìn)行里約奧運(yùn)男籃首場(chǎng)四分之一決賽解說(shuō)。
最后一個(gè)用戶畫像能力。
通過(guò)大量的用戶行為數(shù)據(jù),百度大腦能夠描繪出著名演員胡歌的粉絲群體的基本特點(diǎn)。胡歌粉絲群體的畫像我們從興趣和偏好的角度來(lái)看,其實(shí)在影視、音樂(lè)、公益、旅游、出行。我們看到這里面最大的一個(gè)特點(diǎn)還是旅游出行,而不是影視音樂(lè),還是跟常人的思維不太一樣。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.lukmueng.com/
本文標(biāo)題:李彥宏:百度大腦為什么是“核心中的核心”?
本文網(wǎng)址:http://m.lukmueng.com/html/news/10515320035.html