站長推薦
最近大數據成了顯學,乃至可以說是神學,一門讓大都人都感覺很神的科學。
理論上,只要能夠把握並且整合網際網路上的利用足跡,大數據確實可以很神。不外實際上,假如一味強調大數據無所不能,那就是大騙劇了。
大數據可以多麼神?網路上有如許一個故事段子,非常貼切:
或人打電話去訂披薩,德律風接通還沒說話,客服人員就知道來電的人是誰,並且還知道家住哪裡、手機電話幾號、家裡德律風幾號,原來這些資料都已被整合了。
客戶想訂海鮮披薩,客服人員提醒按照醫療紀錄,最好不要吃海鮮,還說參考曩昔查閱的資料,勸訂健康披薩,而且自動根據定戶家裡人數建議披薩大小,順帶提示老母親剛動過手術不宜吃太多。
客戶要刷卡,客服人員連刷卡紀錄跟銀行可用額度都知道,而且提示客戶方才刷了共用單車,定位顯示人就在四周,無妨自己來取。最後順帶根據客戶的情人資料,溫馨提示等等去約會時,應當帶什麼物品。
故事會太誇大嗎?不會。理論上都做獲得。不外現實上卻不一定,因為要看使用者日常糊口的上彀水平,和各家網站數據的整合程度。
簡單說,若是有人幾乎都不上彀,大數據就找不太到他的資料。當各家網站的數據沒法真正整合,披薩客服人員只會知道客戶過去的訂餐記載,固然不會知道醫療、金融、交通等其他紀錄。
有一個跟大數據相幹的概念,比來也受到良多正視,尤其選舉快到了更是如斯,這就是網路上的社群凝聽(social listening),和相幹的網路聲量分析。
社群凝聽以及網路聲量,就是追蹤及闡明網路上對某些人物或是主題的會商情況,包孕正、負評價的次數,和最常伴隨出現的文字(構成文字雲)。
初度看到網路聲量分析的人,必然會感覺大數據很神,居然可以挖掘出網路上是怎麼計議某些人物或是主題。
道理說起來也不複雜,主要就是透過Hadoop或Spark這些既有的程式框架,發展出機械進修的程式,到網路上索引和跟踪相關數據。
網路聲量闡明有三大關頭:一是程式發展能力,二是納入分析的網址及社群網站,和追蹤的辭彙數量,三是語意闡明的能力。
若是程式不優、網站及辭彙數目不多、語意分析不佳,那麼就算跑出有模有樣的大數據分析圖表,卻完全沒有參考價值,並且還會誤導,底子就是大騙劇。
就算大數據剖析的程式優、網站及詞彙數量多、語意闡發佳,仍是要謹慎,因為這反應的是積極參與討論的網友的意見,未必是全部網友的心態,此中更沒有包羅不太上彀的群體。對大數據過度解讀,一樣會變成大騙劇。
大數據確實很神,在網路時期人人要懂才能善用,也避免大數據釀成大騙劇。
●作者:賴祥蔚/台灣藝術大學廣播電視學系教授、中華傳播辦理學會理事長
●本文為作者評論定見,不代表《NOWnews今日新聞》立場
●《本日概念》開辟分歧的視野
●《本日廣場》接待來稿或介入接洽,文章接待寄至public@nownews.com
文章來自: https://tw.news.yahoo.com/%E5%90%8D%E5%AE%B6%E8%AB%96%E5%A3%87-%E8%B3%B4%E7%A5%A5%E8%94%9A-%E7%95%B6開箱
留言列表