《數據、謊言與真相》: 為什麼人類愛說謊,卻願意把真相賣給 Google ?
今天 Google 了嗎?這是日常生活中,最常發生事情。不知不覺透過這渠道,也累積了大量數據,而這些數據卻可以幫我們解密,那些人類說不出口的真相。
由於 Google 搜尋引擎的發明,很多人不求籤拜佛,只求問問 Google 來解心中疑惑。所以作者提到:「人會騙人,但數據簡單明確的展現人的行為,所以數據會說實話,同時透過這些數據,得以重新認識自己與世界」。
其中提到像政治操控、藉由哪些數據,來盤算失業率,文字、對話探勘,來解析那些人們那些不願說出口的真相(這就是所謂的『嘴巴說不要,身體很誠實?!』。
基本上,作者透過層層頗析、盤點數據,找出關聯性,最後得出結論。很有次序帶領我們走過他的思考路徑。
下面會舉出一些書中有趣例子,來跟大家分享,到底數據是如何揭露人類的謊言,那我又從這些內容裡面學習到了什麼呢?
在開始前,要跟大家先說一下,這是一本吃了「誠實豆沙包」的書,告訴你些令人震驚的事情,且在臉書上面看不到的一面。文章內容主要分為:哪些數據是關鍵指標、和如何透過文字探勘,找出人們的『言下之意』。
如何預測風向,那些數據又是重要關鍵 ?
川普勝選讓你跌破眼鏡?那是你沒有看懂數據
在2016 年時候,投票專家斷定川普沒有機會勝出。畢竟,川普砲火猛烈攻擊少數族群。當專家告訴我們很少美國人認同這種羞辱,所以我們都定川普定在美國大選中落敗。
但其實網路上有一些線索顯示,川普可能會得初選和大選。
透過 Google 趨勢,可以告訴使用者任何字詞和短語在不同地點和不同時間被搜尋的頻率。或許讓朋友之間可以討論哪位名人最受歡迎,或者哪種時尚突然變夯。
正因為這樣的工具,我們能獲得更多資訊,可以真正了解人們真正在想什麼、渴望什麼、恐懼什麼和真正做了什麼。
由於人們不僅僅在 Google 上面進行搜尋,我們搜尋是為了要解決的問題,所以在搜尋欄中吐露真心,如:「我討厭我老闆」、「我爸爸打我」等,所以網路足跡就更有真實性可言。
數據強大之處在於,人們會把自己可能不會告訴別人的事情,告訴這個大型搜尋引擎。
Google 能告訴你,是誰在說謊?
舉一個書中有趣的例子:「以性方面的研究為例,問卷調查無法切確告訴我們有關於人們性生活的真相。根據調查,有關於異性性行為時,女性表示自己每年平均有進行五十五次性行為,其中使用保險套的次數只佔一六%。
加總起來,就是説每年用掉約十一億個保險套,但異性戀男性則說每年使用十六億個保險套。照理說這些數字必須要一樣,究竟是誰說了真話,是男人還是女人?」
結果,男女雙方誰也都沒說實話。尼爾森表示,每年賣掉的保險套不到六億個,所以大家都在說謊。藉由 Google 搜尋的數據告訴我們,已婚男士的性生活並沒有那個活躍,而且作者認為 Google 搜尋數據比較準確。
在Google上面,人們對於婚姻最多的抱怨就是沒有性行為。「無性生活」的搜尋比「不幸婚姻」的搜尋多出了三·五倍,比「無情婚姻」的搜尋多出了八倍。
如何找出數據間的關聯性:每月失業率如何計算?
過去都用高盛和其他許多金融機構,來提供「每月失業率」狀況。但是政府機關卻要花費三個月時間來獲取失業率的資訊,可以說是資源不夠,或者是這些政府機關還活在過去二十世紀的思維中。
由於現在網路科技,或許我們真的可以透過某處數據來驗證「失業率」。但應該以哪個數據為主呢?從一個例證發現,病人在就醫之前喜歡透過關鍵字的查詢來驗證是否自己生病,所以當病人打上「肌肉痠痛」或者是「流感症狀」,很有可能就是流感傳播速度重要指標。
最近武漢疫情上升,大家或許也可以試著查查看相關關鍵字。像:武漢肺炎、中國疫情、台商返台、排華情緒等。
與此同時,Google 工程師設計出查詢相關性 Google Correlate。透過這項功能,人員可以隨時隨地查看他們正在追蹤的任何數據系列,並查看與該數據及最相關的 Google 搜尋。
像是當房價上漲時候,美國人往往會搜尋「八成/二成房貸」、「新屋建商」、「增值率」這類字詞。房價下降時候,美國人往往會搜尋「虧本出售過程」、「貸款負債註銷」等。
所以當把美國失業的輸入到 Google Correlate,會有什麼結果呢?你猜想可能會是「就業服務中心」、「就業補助」的字眼。這些字詞的確是很高,但卻不是最高的。
其實最高的搜尋量是「 Slutload 」,這是一個色情網站。相信當你看到這個答案你應該也會很傻眼,但其實就以行為來看,失業者大概很多空閒時間,許多人獨自窩在家沒事情做,所以就... 正常 ( ? )
而另外一個高度相關的搜尋為「蜘蛛紙牌」這種非限制級的接龍遊戲,對於很多空閒人來說,這樣高的搜尋量可能就不這麼意外了。
語言分析能告訴你的秘密
語言學數據探勘:Google Ngrams 系統分析
隨著網路和數位化,將大量文件中的字詞列表成,能對人類使用文字的狀況,有更深一步的認知。這個領域重大發現在於 Googel Ngrams。
透過一個例子來驗證,大家覺得美國一個分裂還是團結的國家呢?猜大家的答案都是:「由於政治高度兩極化,當然是分裂!」
但如果由 Google Ngrams 的收尋結果來看,每年使用「The United States are 」跟 「The United States is 」的頻率是逐一增加。在南北戰爭後,將「美國」是為複數名詞是越來愈多,表示這是語言文字上能有分歧。
想不到看穿文字背後的意涵,可以看出一個國家的歷史背景!
從對話內容了解,再次約會機率有多高
另外一個有趣的發現是科學家嘗試透過「對談內容」,來檢驗男女雙方彼此是否存有好感,並想要再次約會。
他們發現,男人表達自己被吸引的方式之ㄧ很明顯的就是,在女人講笑話時,他會笑。另一個比較不明顯的表達方式:說話時候會刻意控制自己的語調,這表示男性遇到喜歡的女性時候,或許會不自覺誇大本身的男子氣概。
女性往往會改變音調來表達自己的興趣,如說話會更加輕柔、講話更簡單扼要。根據女性會使用一些特定的字詞,還有一個關於女性是感興趣的主要線索就是,當女性使用「或許吧」或「我認為」這類模稜兩可字詞時候,就表示可能不感興趣。
像是,她有幾分喜歡的話則會說「有點」冷、「可能」想點另一道開會菜,那他可能「有幾分」、「有點」對你不感興趣。
當女性談論自己時候,可能表示她對你感興趣。所以對於想要找對象的男人來說,你可以從女人口中聽到的最美麗字眼可能就是「我」:這是女性感到自在的一個跡象。如果她使用是「你可知道」和「我的意思是」這種自我標簽的詞語時候,那也表示他對你帶有好感。
到底為什麼呢?就科學家研究,這些詞語想要引起對方的注意,又尤其這些字詞帶有友好溫暖、也表示他或她也在尋找適合的對象。
但殘忍的來了,有一個壞消息說,因為數據似乎證實男性有一個誠實的表現。男性對於女性是否有好感,關鍵因素並不在與對言語上,長相在是預測男性是否對女性有好感的主要因素。(世界就是這麼的真實而殘酷)
還有一種文本就做情緒分析,我們能從這個情緒分析得到什麼呢?就由臉書數據科學家指出一個令人振奮的可能性。他們可以估計一個國家每天國民的幸福指數。但是作者提出疑問說,很多時候我們慣性在臉書上面撒謊,為了告訴大家我過得很好。
實際運用為何?就是在很前面亞馬遜。他們表示,透過「文本轉語音」(Text-to-Speech,NTTS)技術,Alexa已可支援更多情緒語氣,包括興奮、失望、同情等,整體語氣更加自然,能有效提升用戶與 Alexa 的對話體驗。
例如,當用戶所支持的球隊輸掉比賽時,Alexa可以用失望的語氣回覆用戶,聽起來更加有同理心。據亞馬遜的調查統計,當Alexa的回應帶有感情時,用戶對語音體驗的整體滿意度提高了30%。
什麼類型的故事讓人願意分享?
大家猜想可能是負面還是正面居多呢? 書中舉出例子,透過【紐約時報】最多轉載的報導名單之中,使用情緒分類的分法,將報導報導內容情緒加以分析。分析出來結果令人詫異,竟然是正面報導居多。
這可能跟新聞媒體帶給我們的感受不太相同,新聞人士可能為認為 : 「血腥災難和暴力等類型文章,更容易被轉載。」透過分析字詞,也可能讓我們發現人們那些說不出口的事實。
竟然字詞可以幫助了解我們說話的習慣,有沒有可能透過這些字詞的研究,更加瞭自己本身呢? 例如,學習英文也可以利用的模式記錄自己常用詞彙,用詞的方式來與母語人士做比較,或許可以更有效率來增進我們提高語言正確度。
或者是特過這樣詞語的方式,來了解我們每天、每周或每月的情緒起伏,當我們遇到挑戰時候,要如何克服,又如何將我們言語排序更有邏輯,又或許可以從中找到可以直接改善的地方。
總結 : 管他是大數據還是小數據
許多人都對這種發展感到焦慮,他們受到數據的威脅,容易在數字世界中迷失並趕到困惑。他們認為用這種「定量方式」來理解世界,是少數左腦發達天才的事情,不是他們的強項,一旦遇到數據時候,你們就準備舉手投降。
但其實有效數據科學不像人們想像中那個複雜。事實上,最越像數據科學是非常直觀的。
而是什麼讓數據科學變得直觀呢?數據科學的核心跟發現模式和預測一個變數如何影響另外一個變數有關。其實我們可以說每個人都是數據科學家。小時後,你發現自己一哭,媽媽就會注意你,這就是數據科學。長大成人後,你發現如果抱怨太多,人們就比較不會想要跟你來往,這也是數據科學。
直覺那麼美好,我們為什麼需要透過電腦來幫我做計算?如我們所見,當我們沒有電腦輔助光靠直覺時,我們得直覺有時候準的驚人,但有時候卻錯得離譜。常常有機會陷入『認知陷阱』,我們傾向於誇張自身經驗的相關性。
最後,這本書真的非常有趣,歡迎大家去購買來閱讀,會發現原來我們默默都在 Google 面前表露無遺。且研究一個事件可以透過 Google 的關鍵字,來得到不同面向的頗析。
- 那請大力幫我鼓掌,給我動力往下走,10-40拍手對我文章內容的肯定;50拍手,證明鋼鐵V鐵粉忠誠度。- 鋼鐵V社團開張:歡迎大家加入鋼鐵V·職場思領域一起討論新鮮人職場問題、英文學習、個人品牌還有活動發佈等消息,想要參加我所舉辦的活動,千萬不要錯過這個社團。- 鋼鐵V粉絲頁也開張了:鋼鐵 V 。 薇琪職場學,歡迎大家 Follow 來獲取每天最即時的商業訊息、英文學習(面試、簡報還有寫作等)、個人品牌經營、新書推薦(還有送書活動)!*鋼鐵V最近如火如荼舉辦有關於『如何策略性商業英文講座』,如果有興趣的朋友麻煩幫我填寫表單。內容包括:
- 利用商業框架策略性學習英文
- 社交英文會話練習
- 英文聽力訓練
- 短時間單字力翻倍
+ Workshop報名連結:http://psce.pw/J3ER3