首頁 > 科普新聞 > 正文

人工智能的進階之路:授人以愛,授機器以漁
2022-05-07

人工智能與深度學習是當前的熱門領域,但你聽說過“表示學習”嗎?據說參與其中還能提高“脫單”幾率?這都是怎么回事>>>

撰文/記者 趙天宇 編輯/劉昭

新媒體編輯/李云鳳

4月25-29日,2022年第10屆國際表示學習大會(ICLR)以線上的方式召開,這也是從2020年開始,ICLR連續三年在線上舉辦。但這絲毫不影響這個只有10年歷史的“年輕”學術會議,被學術研究者們廣泛認可,成為 “人工智能學術會議領域的一匹黑馬”。

隨著人工智能領域的快速發展,近年來,深度學習在語音識別、圖像分析和自然語言處理領域得到了廣泛的應用和發展。深度學習的基礎是機器學習,當然對于機器學習而言,僅學會深度學習是遠遠不夠的,通過學習獲得特征向量的“表示學習”才是人工智能的進階之路,這也是“表示學習”這個“陌生名詞”近年來在人工智能領域,逐漸占據舉足輕重位置的重要原因。

○ ○ ○

傳統機器學習很依賴人工

表示學習一詞由英文的“representation learning”而來,也會被稱為表征學習,目前業界還沒有統一的叫法。

眾所周知,數據是機器學習的核心,它決定了機器學習的上限,有至關重要的作用。在人類和大量數據的幫助下,電腦可以表現得十分強大,但是離開了這兩者,它甚至都不能分辨一只貓和一只狗。

▲表示學習示意圖(圖片來源/Cloudera)

事實上,這并非調侃,因為傳統的機器學習非常依賴于人工經驗。

舉個例子來說,在計算機當中,我們要把一張臉保存起來并識別,需要程序員自己編寫一串代碼,用以表示人臉。這種方法雖然理論上可行,但是畢竟是人確定的,人難免會出錯,一千張人臉就得寫一千種代碼,與其說是人工智能,更像是“人力工程”。

并且,機器學習的模型通用性往往較差,很難像人一樣,能夠進行快速靈活地學習與應用。比如教一個咿呀學語的小朋友“什么是蘋果”,大人只需要指著蘋果說“蘋果”十幾次甚至幾次,孩子一般就能快速識別各種顏色和形狀的蘋果。但對于機器來說,需要看幾千個甚至幾萬個蘋果的照片才能做到,再復雜一些的語音識別,則可能需要數百萬個示例。

為什么會出現這種情況?令人遺憾的是,這些問題至今還沒有確切答案。編碼是處理信息的第一步,那么人類是如何對圖像進行編碼的?他提取了哪些特征可以通過少量樣本進行學習?這些我們都還不清楚,但這至少給科研人員確定了一個方向,必須對機器進行訓練,讓它們自己掌握確定向量的能力,才能向人腦的方向進化。

(圖片來源/Analytics India Magazine)

○ ○ ○

給機器“授之以漁”

因此,表示學習的概念開始被引入。簡單來說,在機器學習領域,表示學習就是一種將原始數據,轉換成為更容易被機器學習應用數據的過程。

表示學習中,有兩個核心問題非常關鍵,一個是“什么是一個好的表示”,另外一個則是“如何學習到好的表示”。

表示學習的目的,是把復雜的原始數據化繁為簡,把原始數據提煉成更好的數據表達,使后續的任務事半功倍。這與我們耳熟能詳的諺語“授之以魚不如授之以漁”頗有些相似,只不過到了計算機領域中,這種“漁”變得更加復雜和抽象起來。

清華大學計算機學院教授鄧志東告訴記者:“表征(表示)就是分層特征向量表達的意思,所謂表征(表示)學習,說的就是深度卷積神經網絡,某種意義上,也可以看成是深度學習的另一種說法和表述?!?/p>

深度學習是當前機器學習的一個熱門領域,也被認為是第三次人工智能浪潮發展的助推器:相對于淺層學習依靠人工經驗抽取樣本特征,獲得的沒有層次結構的單層特征而言,深度學習通過對原始信號進行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動地學習得到層次化的特征表示,從而更有利于分類或特征的可視化。

所以從本質上來看,表示學習是深度學習的進階版:“表示學習的算法包括了監督、半監督、強化和無監督學習方法等多種,范圍比完全監督的深度卷積神經網絡更寬廣,研究的意義也就更深遠?!编囍緰|說。

日常生活中,表示學習也有不少具體的應用案例:例如我們日常使用的“小紅書”“大眾點評”“美團”“淘寶”等手機應用,首頁推薦欄目的內容來源,就是利用表示學習的算法特點,記錄用戶瀏覽時的商品特征、狀態與上下文信息,最終形成的內容。

同時,表示學習在認知過程當中,也發揮著非常重要的作用。比如人們研究開發自動駕駛技術的核心目的,就是讓機器認知事物,利用機器代替人類,實現防止前方碰撞、防止偏離車道、保持車距等。

○ ○ ○

能“解決婚戀”的ICLR

表示學習從結構上講是數據的一個預處理手段,就如同當下的人工智能發展水平,表示學習還有很多不盡人意之處,對它深層次的邏輯和方法,也有很多可以挖掘和探討的內容。

因此在2013年,國際表示學習大會(ICLR)誕生了,ICLR最早從國際人工智能及統計會議中脫胎,是由深度學習三大巨頭之二的約書亞·本吉奧和楊立昆牽頭創辦的。

▲被譽為“卷積網絡之父”的楊立昆(Yann LeCun)(圖片來源/紐約大學官網)

本吉奧是蒙特利爾大學教授,他領導的蒙特利爾大學人工智能實驗室(MILA)是世界上最大的人工智能研究中心之一,與谷歌有著密切的合作。楊立昆不僅是Facebook首席人工智能科學家和紐約大學教授,還是圖靈獎獲得者,被譽為“卷積神經網絡之父”。

在ICLR之前,人工智能、深度學習領域的學術會議,還缺乏一個場所,能讓學者們交流分享在表示學習中所遇到與關心的話題,而ICLR 的出現恰好彌補了這樣的空白,所以ICLR得到了快速的發展。

此外ICLR推行的Open Review (公開評審)論文評審制度,也讓參與者紛紛拍手叫好:根據規定,所有提交的論文都會公開姓名等信息,任何學者都可或匿名或實名地評價論文。而在公開評審結束后,論文作者也能夠對論文進行調整和修改。

2020年,人們在瀏覽ICLR論文時“震驚”地發現,一名叫Yu Rong的中國年輕人論文在致謝部分一本正經地寫道:“本研究受國家科技部重大專項資助。另外,Yu Rong特別要感謝Yunman Huang多年來的關愛和支持,你愿意嫁給我么?”

▲“震驚”網友的ICLR論文致謝(圖片來源/微博@王威廉)

論文中求婚得到了積極的反饋,被求婚的這位女士在社交媒體平臺上進行了回復:“我就是被求婚的這位!作者已經成功了!”隨即網友們也紛紛送上了祝福。

至此ICLR開始迅速“出圈”。甚至有人調侃,在ICLR上發布論文不僅能夠普及學術成果,獲得“科學食糧”,還能夠增加求婚成功的幾率,高效解決當下年輕人婚戀問題,播下“愛情的種子”,可謂一舉多得。

不到10年的時間,ICLR已經成長為人工智能、深度學習領域最具看點的學術會議,未來可期。這是表示學習本身快速發展的一個縮影,也從另一方面說明,表示學習可能正在成為推動人工智能新一輪快速發展的又一“利器”?!?/p>

了解更多學術前沿動態 請掃描二維碼

出品:科普中央廚房

監制:北京科技報 | 北科傳媒

歡迎分享到朋友圈

未經授權謝絕轉載


更多科普新聞 ......

无码精品毛片波多野吉衣|乱肉合集乱500小说小说下载|高颜值奶水充足哺乳期人妻|成人动漫av免费观看
<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>