hkfew_03_750x420_01240c9d2487b2feea95940c3a6b02684d4.jpg

人工智能=人工+智能?

「人工智能( Artificial Intelligence,AI)」一詞最早誕生於1956年的DARTMOUTH學會上,探究的是如何讓機器擁有像人類一樣的智慧。但在早期階段,由於計算機本身運算能力和存儲處理速度不足,AI發展進程緩慢。隨着科技的進步,計算機內部零件的體積縮小了好幾倍且其計算能力提升了好幾番,AI發展迅速。特別是2016年Google AlphaGo以比分4:1打敗圍棋棋手李世石後,全世界對AI風潮的追捧更上了一層,成為燎原之勢,各個企業公司爭相開發AI產品以搶佔市場。然而,在追趕熱潮的過程中不可避免地出現了一些瓶頸與障礙,值得我們深思。

香港理工大學工業及系統工程學系與企業合作的智能倉庫項目,提供標註了人類、
貨架與貨物等不同類別事物的標籤數據,幫助倉庫機器人識別周遭環境,有效避障。

人工偽裝智能

由於創建一個真正的AI產品並不是一件容易的事情,有些公司為了拉攏融資與搶佔先機,魚目混珠,用人力代替AI,讓人類模仿機器。例如,Spinvox公司僱用人工聽語音郵件並將其轉換成文字短信,以偽裝成AI語音識別產品;提供Chatbot行程自動設置服務的X.ai和Clara公司被曝用人力來假裝程序;智能掃描收據的Expensify公司也是聘請低薪工人來轉錄數據。這些亂象的出現主要是源於開發人工智能需要面臨大量的技術和業務挑戰,假AI成本很低且能很快實現理想效果。但是,這樣的行為不僅無法實現技術變革,打亂了市場,而且使得投資者對AI領域的投資更加謹慎小心,不利於實際的AI開發。要減少這些披着AI外殼的人工服務的存在,從人才培育角度來說,主要是要增設AI相關課程以及鼓勵學生多參加AI開發方向的活動與研討會。一方面,這些學生將來步入社會,可作為AI開發技術人員,為AI研發公司注入新血液,推動AI方面的技術革新,縮短開發週期,提升公司的研發信心;另一方面,學生作為未來社會勞動力市場的中堅力量,提升了他們對AI技術的認識,也可提高將來社會各界從業人員對新興技術的理解,減少投資被騙的概率。

理工大學工業及系統工程學系研發的網絡實體物流系統,綜合考慮了歷史配送路徑數據和當前配送計劃表,
建立配送路徑優化模型。

人工訓練智能

除了人為模仿的假AI外,市場上的各類AI產品背面也離不開人類的支援,因而有人也聲稱「有多少智能背後就有多少人工」。現任創新工廠董事長一職的AI專家李開復指出,AI的發展需要4個先決條件——海量數據、資料標註、專注在垂直領域上發展和有頂尖科學家的加入。目前通信技術與設備的高速發展使得數據獲取相對容易,然而數據標註道路卻是荊棘滿途。 AI金字塔的底層基礎是數據,數據標註識別之後,再交予機器學習算法訓練調教智能。現階段的數據標註主要依賴人力。在數據標註工廠,標註員們通常需要加班加點才能完成任務。 AI算法的優化取決於數據標註的精確性,可從事標註工作的一般都是完全不懂技術的門外漢。整個作業流程更像是傳統手工行業,出錯在所難免。參照投中研究院發布的數據,雖然在2018年上半年,中國人工智能行業獲得了超過400億元的融資,然而流入數據標註行業的總資金不超過1億元。整體而言,數據標註技術的發展仍是滾芥投針。

目前,工業界的機器學習優化方法的主要步驟是先觀察數據,然後總結規律,並依此建立模型,之後按照數據調整模型參數,最後將模型用於實際案例。這種主流應用主要依靠的是監督學習方法,通過人類標註好的數據並用算法訓練機器,使機器變得越來越智能。在這種情況下,提供越多的數據就能讓機器從中吸取更多的經驗教訓,不斷強化改進,因而有人說:「大數據是好算法」。香港理工大學工業及系統工程學系研究員在研發網絡實體物流系統,透過學習物流從業員的歷史駕駛路徑,從而優化配送路線。GPS數據可以作為原始資料來創建模型,而之後生成的新數據會源源不斷成為新的輸入資料來進一步調教機器,形成正向反饋。在整個監督學習過程中,人的干涉程度始終還是較高。

無人工也智能

AI可分為3個層次:一是弱AI,指擅長單領域的AI;二是強AI,指能在各方面與人類比肩的AI;三是超AI,指在所有領域都超越人類的AI。迄今為止,AI的發展現狀是實現了部分強大的弱AI和非常弱小的強AI。備受矚目的AlphaGo就是圍棋領域裏的弱AI裏的翹楚,它不僅僅研習了人類歷史上的所有棋局,還通過Monte Carlo Tree Search方法不斷自我對戰以提升棋藝。這表明了研發已經到達了無監督學習階段,可用沒有標註過的數據達到目標效果,無需人類的指導。Facebook的AI部門負責人Yann LeCun指出,AI的下一個變革核心是無監督學習、常識學習。 AI的訓練過程類似嬰幼兒培養。在早期階段,需要家長引導,告訴它客觀的一些概念、元素等,也就是監督學習階段;而在後期,由於人類所掌握知識是有限的,需要年輕人自由主動探索世界、發現新事物,也就是無監督學習階段。當前無監督學習發展較為滯後,技術不如監督學習成熟,因而精確度和有效性都較差。為了讓機器學習脫離由人類所決定的極限,發展真正的通用智能,無監督學習研究仍任重道遠。

小結

人工智能發展了60多年,經歷了幾度熱潮與寒冬,誕生了許多影響深遠的理論與算法。雖然有些公司在這時代熱題中渾水摸魚,用人工偽裝AI擾亂市場,但是也有很多企業抓住機遇,培養AI人才,為AI技術的發展增磚添瓦。然而,現階段的AI技術側重於採用監督學習算法,需要大量人工標註數據,局限性較大。未來的AI發展將會將重心逐步轉移到無監督學習算法,減少人類的干預,加強機器的自主性。

李嘉敏 博士
香港理工大學
工業及系統工程學系
助理教授

林冰冰
香港理工大學
工業及系統工程學系
研究員