# A Longitudinal Study on User Information Behavior Researchers from the Perspective of Data Science.
演講者:臺灣師範大學 吳怡瑾 教授
> 我們現在所做的事情,可能現在看不見成果,但可能在未來的某一天會派上用場。
> 雖然在系統的部分都是交由資訊人員去完成,但在背後的資訊行為與決策分析評估,也是整個資訊系統非常重要的一塊,所以在資訊行為與決策分析評估開始會有許多研究者去做這個領域的研究,但不管是系統的前面或是背後所顯示出的資訊,都是連接在一起的,在資訊科技領域會比較著重在於這個系統要如何建構出來,但其實有一派是專門在研究系統做出來後使用者在使用上的行為與背後的意義,所以其實很多想法都是從其他研究中得到新的想法與養份。
> Data scientist須具備領域知識,取得資料,數理統計,雖然Data scientist的工作被稱作是目前最性感的職業,但如果每個領域都熟知,是讓人感到非常枯燥的,所以適時的結合不同領域的領域學家是可以不那麼枯燥卻又能激出新的火花,有一句if you want to go fast go alone if you want to go far go together(如果你想走得快,你得一個人向前,如果你想走得遠,你得團結與大家一起),也許這也就是Data scientist的迷人之處,結合不同領域一起向前進,而不是單一領域單打獨鬥。
> 有名的科學家曾經說過有足夠的資料,資料會說出事實,資料會揭露事實,過去在Data scientist領域的學家會較常使用問卷法,調查法,在這幾年逐漸發現偏向使用資料分析法,所以在各個領域其中對於資料分析也越來越重視,研究的方法也開始有了變化。
> IS,Information seeking, seeking context更為重要,以人為出發點,會發現系統在另外一個層面的問題,能夠更了解系統,過去的IR,Information retrieval稱為LabIR,重視召回率,正確率...等。
> 提出了information seeking and retrieval (IS&R),結合Computer Sciences and Social Sciences兩個學派都有自己不容易跨過去的線,兩個學派若能更加開放是更好的。
> 之後提出User-Oriented IR其中一位學者提出了model,人在找資訊時常常都是處於一個混沌的狀態,其實一開始是比較不清楚自己需要什麼資料,又慢慢的好像知道自己要什麽,但卻會慢慢的屈就於現有找到的資料或情況做一個折衷解,另外一位學者有提出了model,其實資訊探求就像是採草莓一開始都不知道草莓園裡的草莓是大顆或小顆,但採著採著就會漸漸理解大概草莓大小就是那樣,開始告訴自己不用再挑了,草莓園裡的草莓大概就是那些樣子了,所以其實研究就是滿足好奇心的過程,一直去探求自己所需要的論文做研究與參考。
>
> 用系統自動偵測的方法,log data觀察人進入系統後的行為,但在使用者使用的過程中會揭露一些事實,那後面就會提出一些改進系統的方式,系統多了User Model 根據使用者的行為透露了使用者的狀態。
>
> 維基百科➪視覺化做鏈結主要是設定主題,主題地圖而去產生地圖,分析語意路徑,最客觀的方式是人類行為,可以用什麼方式去做評估,不能盲目的開發,要有目的開發功能,還要觀察使用者最不會去用的功能。
>
> 過去的系統只在意準確率,Outcome過程中學到哪些東西,很多變數都需要掌握分析答題,答題時間..等,觀察使用者的滑鼠移動行為,會看到一些使用者使用的行為。
> 總結:設定研究問題,工具開發目的,期待的結果,善用工具去關係使用者行為。
> 就算現在在研究machine learning這個領域,但還是在一個很混沌的階段,在探索尋求我想取得的知識,在做研究的階段,要對於研究問題的好奇和興趣,要帶著一顆熱忱的心來探索這個領域,也許在未來的某一天我也能將在學習的過程中,所碰到的事件做更深入的了解。
> 一直認為突破科學間的界限是很重要的,很多時後應將跨學科的學習當做是一件重要的事情,必須要對於你所研究的領域有所幫助,到另外一個領域去攝取一些概念,對於本身關心得問題產生另外一種不同的啟發。
> 資料會揭露事實,但必須靠人(機器)去找出資料裡面所隱藏的事實,如果人像過去一樣將資料只是當作資料,那麼也無法揭露任何事實。
>
> 我們在找尋某個領域的資料,常常處於資訊爆炸,可以找到的資料太多了,可以看的書也非常的多,所以可能常常會一開始是比較不清楚自己需要什麼資料,又慢慢的好像知道自己要什麼,但卻會慢慢的屈就於現有找到的資料或情況做一個最佳解答,所以其實我們應該建構知識樹,必須對所關心的領域中,有用的書籍或是資料非常熟悉。