台灣產業AI化的問題3〉人工智慧常見的誤解與迷思

人工智慧究竟能做什麼?是企業萬能的問題解答者?還是人云亦云的奧妙玄學?在企業決定是否正式導入AI之前,可以先檢視一下,是否誤解了人工智慧。

簡單地說,問題不在於「有沒有導入人工智慧」,而是「人工智慧導入的程度」,包含影響的範圍、技術的深度,以及與企業營運流程整合的程度,這才是決定未來企業價值的關鍵。

在這堂課中主要分享的是,很多人對於人工智慧常見的誤解與迷思。

在第一堂課時,我們提到人工智慧、機器學習以及大數據這三個大家常見的名詞,事實上是息息相關的。今天的人工智慧系統,底層的引擎都是機器學習模型,而機器學習必須要基於大數據才能淬取出有用的規則。換句話說,我們可以將大數據想成原料,機器學習則是處理這些原料的方法,而產出的結果就是人工智慧。

弱人工智慧 Vs. 強人工智慧

為什麼要再次複習這個概念?因為太多人關注人工智慧、談論人工智慧,還有不少人提出警告,說人工智慧即將取代多數人的工作。對於技術的不夠熟悉,再加上大眾媒體的推波助瀾,甚至還出現「人工智慧末日論」,好像人工智慧就快要統治人類了。

事實上,只要對於人工智慧技術稍微有點認識,就會知道這些擔心是多餘的,這幾年進展快速的是「弱人工智慧」,這一波人工智慧的主流是透過機器學習,從資料裡頭淬取規則,把某一個工作做到最好;真的會思考、會推理、自我學習,能跟人對答如流,甚至還有自我情緒的「強人工智慧」,連影子都還沒看見。最樂觀的預測是,電影中所出現的強人工智慧,也許會由下一世代的人工智慧實現,但不會是我們今天所談的人工智慧技術。

但即使是弱人工智慧,因為已證明在許多產業應用上的價值,讓許多企業趨之若鶩,不論本來談不談、做不做資料科學及大數據研發及導入的企業,今年都開始談人工智慧。他們可能說,我們已從大數據「進化」到人工智慧,比其他還在做大數據的公司更「先進」,這種有趣的說法,正好見證社會上有些人的不求甚解,經常在未真正瞭解一個詞彙之前就開始使用。

大數據、機器學習及AI不可分割

事實上,大數據、機器學習及人工智慧是不可分割的。大數據是資訊來源,機器學習是處理方法,從大數據中萃取出複雜的規則,讓電腦展現出擬似人類智慧的行為,就是我們所說的人工智慧。換句話說,以今天的技術來說,大數據及機器學習是發展人工智慧的必要條件,一家不重視數據及軟體人才的企業,不可能瞬間搖身一變,成為人工智慧見長的公司。

而企業發展人工智慧時的迷思,往往也就出現在這些環節。依據我觀察與協助企業的經驗來看,在大家發展人工智慧時,經常卡在一些常見的迷思及陷阱。

第一個迷思:資料等於價值。蒐集的資料,要經過處理、分析及開發資料產品,資料產品可能只是個影響決策的模型,也可能需要徹底改造營運流程,才能真正為企業產生價值。很多公司光是蒐集資料,從來沒有驗證資料的完整性及正確性,也沒注意過資料之間的斷點,也就是資料集之間是否能夠連結。要知道很多價值是在於資料的連結,而不是資料本身。

例如我知道某一群人的薪水,也知道某一群人的姓名,這時候最有價值的資料反而是姓名與薪水之間的對應。另一個例子是大家所熟悉的AlphaZero,在圍棋、象棋、國際將棋天下無敵手的圍棋程式,它完全不需要歷史資料,而是根據圍棋規則自行對奕產生資料來建立人工智慧。它的厲害在於演算法,而不在獨家資料。也就是說,好的資料固然重要,但機器學習及計算硬體的進步,才是實現AlphaZero的主因。

第二個迷思是,牽涉到資料的工作,就是IT部門的責任。很多公司認為與電腦、資訊相關的工作,就應該由IT部門負責,但其實資料科學家與IT人員的訓練是完全不一樣的。資料科學家必須具備四大領域的能力:數學與統計、程式設計與資料庫、領域知識以及軟性技能,包含溝通能力,而IT人員通常著重於程式設計與資料庫領域的技能,普遍缺乏進行資料分析及機器學習最需要的數學與統計訓練,再者可能也缺乏領域知識、商業經驗以及軟性技能,基本能力有相當大的差異。

第三個迷思是,資料分析就是分析ERP、CRM系統中的資料。企業常以為資料分析僅限於分析公司內部資料庫中的結構化資料,這也是為什麼管理資料倉儲人員通常直接被賦與資料分析任務的原因。但其實非結構化資料,例如影像、聲音、影片、文字等等,經常蘊含更大價值,卻往往被忽略。也因此,很多公司的資料分析成果就是報表、報表及更多的報表,讓主管們來解讀,這還真是暴殄天物啊。

第四個迷思是,電腦的決策怎麼可能贏得過業界歷練二十載的我呢?若你有這種想法,你可能不知道Amazon在1995年時,曾經讓一群50人的資深編輯團隊與演算法PK,看看誰推薦的書單,使用者比較容易買單。結局我想你一定猜得到,那個資深編輯團隊很快就輸了、解散掉,此後Amazon的書籍推薦都由電腦來進行。

事實上,就連醫療診斷都已證明,人工智慧基於X光片、fMRI及病理切片上,判斷肺癌、乳癌、眼底視網膜病變,都優於訓練有素的醫師了。也就是說,只要是有清楚訊號及回饋的問題上,只要有足夠的樣本,人工智慧都有機會優於人類的判斷;就算準確率差不多,人工智慧通常也比較快比較便宜。因此,還是要清楚判斷人工智慧的優勢與極限,再來看如何導入,而不是一昧的認為,我的領域比較特別,我的多年經驗絕對無法被取代之類的。

除了上面提到的這些迷思之外,我覺得最關鍵的問題在於「速食文化」的心態,前幾年,大家發覺資料科學及大數據的重要性,所以各種不同產業都導入所謂的「大數據平台」。但導入平台之後突然發現,咦,怎麼沒有效果?因為,所謂的大數據平台只是收集、承載、處理資料的系統,平台只是一個工具,而所有的工具,都要有清楚的目的及能夠用得對、用得巧的人,才能讓工具產生價值。

接著,人工智慧又席捲而來,企業同樣開始購置設備,導入國外科技大廠的技術,然後認為自己已經搭上人工智慧的列車。要特別提出這點的原因是,資訊管理系統,如ERP(企業資源規畫)、CRM(顧客關係管理)等平台,直接導入當然沒有問題。但是,人工智慧不一樣,它並不是一個資訊系統,而是一種最佳化的工具,它可以應用在企業流程、內部管理、產品設計、行銷等各個環節來輔助甚至直接決策,因此並不是單一的系統,也沒有標準作法,無法直接導入。

簡單地說,問題不在於「有沒有導入人工智慧」,而是「人工智慧導入的程度」,包含影響的範圍、技術的深度,以及與企業營運流程整合的程度,這才是決定未來企業價值的關鍵。

今天的課程在此先告一段落,在下次課程中,將會用前三堂課的概念為基礎,進一步討論人工智慧在企業實際運作中常會面對的困難與挑戰。

  • 主辦暨執行單位:
    財團法人台灣人工智慧學校基金會
  • 協辦單位:
    中央研究院資訊科學研究所、中央研究院資訊科技創新研究中心
  • 捐助企業:
    台塑企業、奇美實業、英業達集團、義隆電子、聯發科技、友達光電、新光人壽-新壽管理維護