不忘初衷,對資料科學執著始終如一



一直以來,陳昇瑋對於「真相」充滿執著,這股動力也促使他選擇以真實的資料做為研究方向,並且從此投身於資料科學領域,走出一條與其他學術研究者不一樣的路。

鑒於台灣資料科學、人工智慧的應用裹足不前,大數據被當做人云亦云的玄學與銷售話術,「我們來做!」成為陳昇瑋心中迫切的使命。自2014年至2017年連續舉辦四年「台灣資料科學年會」與「台灣人工智慧年會」,與會人數年年刷新記錄,成為台灣大數據與人工智慧的指標性活動。他說:「學者其實只要願意跨出一步,也有能力以自己的方法來引領社會,提升大眾的認知,促進產業的前進與提升。」


以下內容摘錄自《人工智慧在台灣:產業轉型的契機與挑戰》

從資料找真相 真相中有價值

從小我對於資料就特別執著,從大一擁有自己的電腦開始,就有定時做資料整理、歸檔及備份的習慣,因此從1994年開始,我所收到及寄出的每一封電子郵件,包含在BBS上收發的信件,至今都妥善保存。在沒有智慧型手機的時代,甚至還手動把一則一則的簡訊鍵入電腦歸檔,只要已經發生的,就希望保存下來。

資料蘊含著真相,而真相就有價值,端看如何去使用。問我為什麼要花力氣整理資料,不為別的,我單純地希望所有發生的事情被記錄下來;同時,蒐集與整理資料對我而言,莫名地充滿樂趣與成就感,似乎也引導著我的職業生涯。

同時,因為從小喜歡電腦遊戲,我一直希望能夠分析真實的遊戲資料,瞭解線上遊戲的運作以及改善其在網路、系統、安全層面的表現。當時透過朋友介紹,得到宇峻奧汀科技公司的支持,拿到在伺服端的 20 個小時網路封包記錄,那是當時我唯一能拿到的真實資料,十分感謝與珍惜。因此,我花了兩年深入分析與研究,從通訊協定、網路效能、伺服器設計、使用者行為、帳號盜用等不同方向切入,發表十餘篇論文,也讓我拿到博士學位,可能是全球第一個基於線上遊戲真實資料來分析研究的博士論文。(延伸閱讀:線上遊戲與雲端運算:福克斯大神之謎)



創辦台灣資料科學年會與台灣人工智慧年會

2014 年創辦的台灣資料科學年會,不但是我個人跨界的一大步,也是台灣資料科學及大數據領域凝聚能量的開始。

當時,眼看中國互聯網三大巨頭百度、阿里巴巴、騰訊正在徵求資料科學家與資料工程師,而台灣雖然已有許多人對大數據琅琅上口,專有名詞的各種錯用誤用滿天飛,卻還沒有人真正了解,大數據背後的資料科學究竟有多大價值。

我曾在 2014 年邀請 Google 深度學習專家在中研院進行免費演講,結果 800 張票在 3 分鐘內索取一空。這代表我們多數的研討會並沒有真實滿足大家對於最新技術與知識的需求。這也開啟從 2014 年到 2017 年連續四屆台灣資料科學年會,並在 2017 年同步舉辦台灣人工智慧年會,成為台灣在資料科學/大數據及人工智慧的指標活動。

創立台灣資料科學年會之前,我就設定好此會議的基調—它不應只是啟發聽眾對於資料科學的興趣及期待。我希望年會能夠真正把那些「聽說的」、「在國外發生的」以資料科學創造價值的工作,究竟在技術上怎麼達成,一一解說清楚。





2014 年首度舉辦年會,兩天的活動,800 張門票在一個多小時內被搶購一空; 2015 年,活動延長為四天,1300 張門票在一個小時內售完;2016 年,同樣四天的活動擴大舉辦,分為三個平行場次,共邀請 50 位講師,參與人數達 1800 人,年年刷新記錄。

2017 年因應大眾對於人工智慧新知的求知若渴,決定以雙年會的形式來擴大舉辦,名為「台灣人工智慧年會 x 台灣資料科學年會」,共邀請 130 位人工智慧及資料科學專家學者來分享。為這場會議,我特別邀請 AlphaGo 主要研發者黃士傑博士擔綱主題演講,這是他在 AlphaGo 打敗韓國棋王李世乭後的首度公開演講,在台灣掀起一波前所未見的人工智慧旋風。

從 2014 至 2017 這四屆年會,引領也同時見證台灣產業界對大數據、人工智慧的重視程度與日俱增。雖然與我的學術研究本業完全無關,推動台灣資料科學年會及台灣人工智慧年會是我個人重要的一步,我發現,其實學者其實只要願意跨出一步,也有能力以自己的方法來引領社會,提升大眾的認知,促進產業的前進與提升。

複習 2017 年「台灣人工智慧年會 x 台灣資料科學年會」陳昇瑋的精彩演講。