新浪科技 辛苓
谷歌這一年,在AI方面都有哪些成果與進展?
年末將至,近日谷歌在東京舉辦了一場分享會,圍繞Made with AI對過去一年的成果做了總結。
谷歌資深研究員,Google Brain 負責人Jeff Dean開場提綱挈領地講到:我們在人工智慧領域的願景,是通過三種途徑讓每個人都從中受益:
使谷歌的產品更加實用;
幫助企業和開發者創新;
為研究人員提供工具,從而解決人類面對的各項重大挑戰。
AI賦能軟體:
Jeff提到,機器學習是谷歌在人工智慧領域的工作重心。作為計算機科學的一種形式,他認為機器學習編寫能使計算機自主學習如何變得智能的程序,要比直接編寫智能程序要更為簡單。
說到谷歌開展機器學習的研究,Jeff再次使用了谷歌在2012年關於機器識貓的論文,和2015年穀歌開源TensorFlow這兩個重要事例。現在,TensorFlow是GitHub上最受歡迎的工具。
Jeff認為,機器學習仍處於發展初期。如今,機器學習對分類,預測,理解和生成這四個關鍵方面很有幫助。這些功能幾乎被應用於谷歌所有的產品中,使產品更加實用,例如:谷歌相冊,谷歌翻譯,谷歌地圖和Google Lens等等。下面分別做一簡要總結介紹。
谷歌相冊(Google Photos),被重點提出的功能是照片搜索(Photo Search)。谷歌相冊可以通過圖像識別妥善分類所有照片,使查找更方便。
而谷歌翻譯(Google Translate),可以和谷歌相冊結合起來使用。用相機照下的圖片,它可以幫你翻譯出來。
Jeff介紹,事實上翻譯這項工作已經持續了十年。在過去,翻譯系統並非基於神經網路的系統,而是使用更簡單的統計翻譯模型,由50萬行代碼組成。2016年推出的新神經網路機器翻譯系統經過了簡單卻有效的數據訓練。新系統僅由 500 行TensorFlow代碼組成,而非50萬行。
「我們去年秋天開始使用新的神經網路翻譯系統后,翻譯準確性得到了很大的改進,可比肩過去十年中取得的提升。」
現在,谷歌將神經網路機器翻譯應用到了97組語言對中。效果提升最明顯的是日英互譯。
谷歌地圖(Google Map),即便在沒有數據許可的情況下,通過衛星的介入,加上機器學習和計算機視覺等技術也可以產生可用的地圖。
Google Lens,可以把你看到的東西搜索出來,得到相關的信息。
而文本理解能力的提升,讓Gmail更好用。比如智能系統通過讀取內容和預測回應,可以給用戶提供回復答案或建議。Gmail數據顯示,目前有12%的回復來自手機,這將使人們的日常工作更加便捷。
這裏值得一提的是谷歌助理(Google Assistant),它的核心技術是語音識別,包含了很多機器學習的相關技術。「沒有人工智慧和機器學習這個產品是不可能存在的。」Jeff強調道。
使用 Google Assistant,用戶可以與谷歌進行自由對話,從而完成不同種類的任務,比如尋找某一問題的答案、導航服務、獲取新聞或得到日程安排方面的幫助。
Google Assistant 可以在不同設備間通用。目前,Google Assistant 可使用的國家和地區包括:
澳大利亞,巴西,加拿大(英文和法文),德國,法國,義大利,印度(英文,印度文),印度尼西亞,日本,韓國,墨西哥,新加坡,西班牙,英國和美國(英文,西班牙文)。(是的,並沒有中國。)
在YouTube上,谷歌通過機器學習給超過10億的視頻自動加上字幕,使得有聽覺障礙的人可以看到視頻中的對白。
軟硬結合:AI賦能硬體
Jeff介紹了谷歌將新型的硬體與軟體相結合的一個實例:Pixel Buds。它是能將使用者周圍人說的話實時翻譯成使用者母語的耳機,運用了語音識別和翻譯技術。
Google產品經理Isaac Reynolds介紹了新款Pixel手機中的人像模式( Portrait Mode)。
機器學習和計算攝像的結合為新Pixel手機的人像模式賦能。通過這個功能,使用者可以拍攝背景平滑模糊的人像圖片。拍攝這種照片,大攝像機一般需要多個鏡頭,而Pixel僅需正反各一個鏡頭。
這就是谷歌在硬體方面正在採用的新處理方式:讓硬體、軟體、以及 AI 相互結合。
接著,Isaac介紹了Google Home中的語音配對功能(Voice Match):機器學習的加入有助於識別不同的語音,使最多六個用戶連接到同一台 Google Home。
在機器學習和語言方面,搜索項目總監Linne Ha介紹了語音搜索和文本轉語音項目。
語音搜索 (Voice Search),指在機器學習的幫助下,自然語言處理系統能夠更好地理解人們想說的話。Linne介紹道,谷歌的語音搜索現在支持119種語言,其中包括11種印度語言和3種印度尼西亞語言。
Project Unison,是一個利用機器學習實現文本轉語音 (Text-to-Speech)的實驗項目。通過轉換引擎,手機可以用語料並不豐富的語種,如孟加拉語,高棉語和爪哇語與您對話。而機器學習模型有助於減少構建文本到語音模型所需的數據量。
新浪科技總結下來,谷歌的策略就是「軟硬結合、硬體打通」,讓語言、語音和圖像技術在各個應用設備上和場景中的使用得到無縫接合。
AI賦能開發者:
谷歌為企業及開發者提供三種創新工具:TensorFlow,雲機器學習 API (Cloud Machine Learning APIs) 以及張量處理器 (Tensor Processing Unit, TPU) 電腦晶元。
其中TensorFlow現在有1萬的全球開發者在使用。使用TensorFlow的企業中包括中國企業,比如小米。
最後一部分是Google產品經理Lily Peng介紹如何用AI讓世界更美好。人工智慧還能應用於醫療、環保、節能、動物保護等等各方面。
讓AI惠及每一個人:
分享會的最後,Jeff 再次上台,介紹了當下時間內谷歌在AI方面的一些思路。
Jeff提到,作為一家 AI First 的公司,谷歌希望讓每個人都能夠從人工智慧中獲益。 目前已經取得了一些進展,但是仍然有一些困難需要克服,例如:
首先,需要想方設法讓機器學習模型的創作過程更加觸手可及:
對此谷歌的解決方案是提供培訓:谷歌明年將在互聯網上提供免費的機器學習課程。現在已經有 1.8萬名谷歌員工參加過此項培訓。
第二點,谷歌正在研究如何使用 AutoML 自動創建機器學習模型。
為了確保谷歌構建的機器學習模型具有包容性,並且能夠真正為每個人所用:
谷歌啟動了People + AI Research (PAIR) 計劃,旨在將谷歌的研究人員聚集在一起,研究並重新設計人與人工智慧系統交互的方式。Facets 正是此計劃所孕育出的一種工具,能夠 將用於機器學習的訓練數據可視化。
谷歌還與Geena Davis 研究所合作建立了GD-IQ,一種利用機器學習檢測電影中性別偏見的工具。
總之,Google在AI方面的長遠目標,就是要讓機器學習、AI觸手可及。
來自: http://news.sina.com.tw/article/20171130/24808236.htmlLVLV包包LV皮夾LV皮夾LV旗艦店
留言列表