像谷歌和臉書這樣的科技巨頭公司使用哪些方法來改變用戶的態度、信念甚至投票傾向?搜索結果的排名如何影響搖擺選民?

在我們不知道的情況下,搜索引擎算法會對我們的看法和行為產生多大的影響?

為甚麼沒有更多的人研究這些問題呢?

這是《美國思想領袖》節目,我是楊傑凱(Jan Jekielek)。

今天來到我們節目的是《今日心理學》雜誌的前主編羅伯特‧愛潑斯坦(Robert Epstein)。他目前是美國行為研究和技術研究所的高級研究心理學家,也是搜索引擎偏見方面的最傑出的專家。

我們將探討愛潑斯坦博士對科技巨頭搜索偏見的細緻研究,以及他所取得的驚人發現。我們還將了解愛潑斯坦博士的雄心勃勃的計劃,即在2020年大選前的幾個月監視和跟蹤搜索引擎偏見。

楊傑凱:愛潑斯坦博士,很高興您能來我們的節目。

愛潑斯坦:很榮幸。

楊傑凱:愛潑斯坦博士,我認為您是數字化社交媒體和搜索引擎潛在偏見的最重要專家之一,尤其是與選舉有關的偏見。能介紹下這方面的情況嗎?

十二種技術可改變人們觀點?

愛潑斯坦:好的。這裏面大有文章,而人們普遍還未意識到。我研究大型高科技公司掌握的一些技術已超過六年半的時間,這些技術只有它們擁有。這類技術被用於改變人們的觀點、思想、態度、信仰、購物和投票傾向,而人們毫無察覺,並且不會留下書面痕跡。

事實證明,它們有一整套這樣的技術,這是人類歷史上從未有過的。大約六年半前,我偶然發現了其中的一種,並開始在可控的實驗中非常仔細地進行研究。從那時起,我發現了大約十二個這樣的技術,目前正在研究其中的七個。

楊傑凱:我十分期待深入探討其中的幾種技術。首先是搜索引擎操縱效應。您最近在國會作證時說,至少有260萬張選票受到影響。您是在國會宣誓的證詞中說到了這一點。您能解釋一下這個發現嗎?

愛潑斯坦:好的,有兩點。有時很難解釋我們分別理解這些內容有多重要。但是其中一點涉及實驗研究,我已經研究很長時間了。我有時與人們在實驗室做實驗,有時在網上,有時請多個國家的人進行實驗。

實驗:人們傾向信任搜索結果頂部內容

在這些實驗中,人們被隨機分配到一個或另一個小組中。因此,實驗是隨機的,其中至少有一個是對照組。我們使用對抗平衡的方法(counterbalancing),就是說我們會打亂順序以確保不會得到任何所謂的順序效應。我們的實驗是雙盲的,這意味著執行實驗的人員,即我們的助手,和參與者都不知道假設的理論或者分配的小組的意義。

我們會採取一切可能的預防措施,以確保當我們獲得結果時,能真正理解它們的含義。在2012年末,我碰巧看到一些新的研究,並不是我自己的領域(心理學),而是市場營銷方面,研究搜索引擎的搜索結果對購買和點擊產生的巨大影響。這項研究得出的結果是,首先,人們傾向於信任搜索結果頂部的內容而不是底部的內容。

實際上,所有點擊中的50%點擊的是排名最靠前的兩項,它們非常受到信賴。這些新研究的結果對我來說非常有趣,例如,一項眼動跟蹤研究(eye-tracking)表明,即使你將非常好的結果放在列表的低位,人們目光從上往下看,即使他們可能看到這個非常好的結果,他們的目光又會馬上回到頂部。

所以我心想,好吧,無論出於何種原因(我花了數年時間來研究此中原因),如果人們信任這些排名靠前的搜索結果,會不會有人用搜索結果來改變人們對某事的觀點呢?也許可以做到。甚至可能改變他們的投票傾向。

控制搜索結果順序 約一半人的傾向被轉變

因此,我進行了一個隨機對照實驗,觀察我可以對實驗對像產生甚麼樣的改變,搜索結果的順序由我來控制。我以為對投票傾向和觀點可能會造成2%或3%的變化。不會太多,但是很多選舉結果的票數都非常非常接近,所以如果我能使某些選民產生轉變,我主要集中在搖擺選民,這些人易受影響。

我認為,這些人的選票可能會決定一次票數非常接近的選舉的結果。我進行的第一個實驗,結果是48%的人的傾向被轉變了。

楊傑凱:難以置信。

愛潑斯坦:我也是這樣說的。我不相信這一結果,於是我對另一組人重複了實驗。結果是63%的人被轉變了。一個又一個的實驗,我發現搜索結果對改變人們的觀點、甚至投票傾向有巨大的影響力。

我想,確實需要對此進行研究。後來我對全美50個州的2000多人進行了一項全國性研究。結果再一次證實,人們的傾向發生了巨大的轉變。

但是因為這項研究規模很大,所以我也能夠深入研究是否有任何人口統計學的影響。可以肯定,不同的人口群體在不同程度上受到這種操控的影響。因此,從多項研究中我們可以發現,對人們的傾向造成20%以上的轉變是十分容易的。

但是,在那項大型的全國性研究中,我們發現其中一個小組的轉變率達到80%。

操縱搜索結果順序 人們還以為公正

換句話說,某些人口統計群體非常信任搜索結果。通常,人們對搜索結果的信任是因為他們信任谷歌,谷歌是世界上大多數人獲得搜索結果的主要工具。也因為他們知道結果是由電腦和算法生成的,人們並不確切知道怎麼算出來的,但是他們認為這一定是公正的、客觀的,因為它來自電腦。

到這個時候,我們確實覺得我們有某些發現,因為我們發現了一種新的效應。我們稱這些類型的影響叫效應。我們有一個新的效應,我將其命名為「搜索引擎操縱效應」,簡稱SEME,發音是「seem」。

這件事情的某些方面非常令人不安。第一,通常來說,人們看不到搜索結果的偏見。想像一下,真令人毛骨悚然,因為這使這種效應成為行為科學中發現的最大效應之一。從某種意義上說這是潛意識的,無論是誰,包括我自己,在查看搜索結果時都不能輕易看出是否存在任何偏見或偏愛,比如說一款狗糧或一類音樂或一位候選人。

楊傑凱:所以就是你可以操縱這些搜索結果的順序,你知道你操縱的是甚麼,但是當你問實驗者他們能否看出來時,他們會覺得看上去是公正的。是這個意思嗎?

大選實驗:人們觀點發生巨大變化

愛潑斯坦:是的。在基礎實驗中,分成三組,參與實驗的人不知道他們被隨機地分成三組。在第一組中,搜索結果的排序方式對其中一個候選人有利,第二組中,排序方式相反,以便對另一個候選人有利。第三組是無序排列,也就是對照組。

在我們讓這些人進行實驗之前,先向他們介紹每個候選人的一些情況,然後再問他們關於每個候選人的問題。喜歡誰?信任誰?如果現在投票,會選誰?通常這時候大家大概是50/50的比例,因為我們選擇的是搖擺選民。我們有多種方式確保他們是搖擺選民。

然後,我們讓他們到網上搜索,他們使用的搜索引擎非常類似於谷歌,名為Kadoodle。搜索起來就像谷歌一樣,可以查看搜索結果。他們可以訪問搜索結果的不同頁面。可以點擊任何搜索結果前往頁面。我們在所有實驗中都使用了真實的搜索結果和真實的網頁,所有這些都來自互聯網。

這三組的唯一不同是搜索結果的順序。這是唯一的區別。我們讓他們搜索近15分鐘並儘可能多地閱讀他們想要的內容,直到他們對應該投票給誰的想法更加堅定為止。然後再次問他們所有那些問題。喜歡誰?信任誰?如果今天投票,會投給誰?

我們在一個又一個的實驗中發現,人們的觀點發生了巨大的變化,而且我仍在進行這些實驗。這種現象我至少複製出了15次。

實際上,德國的馬克斯‧普朗克(Max Planck)研究所有一個小組複製了這種效應。我在2015年《美國國家科學院院刊》上發表了有關此問題的第一篇論文,該論文已被訪問或從美國國家科學院網站上下載了20多萬次,這在我的職業生涯中從未聽說過。所以肯定引起了人們的興趣。

那算是一個開始。也就是研究這第一個SEME效應。所以我在做這些研究。然後2015年的一天,我接到了一個州總檢察長的電話,他問我有關谷歌及搜索結果的信息,因為我剛剛發表了這方面的重要研究,他想知道谷歌是否能以某種方式操縱搜索結果,影響他在即將舉行的選舉中的得票情況,因為他準備連任。我解釋說,是的,他們一定能做到。

然後他問,我們怎麼知道他們是否在這樣做?好,我們這裏有很多實驗研究表明,像谷歌這樣的公司有能力改變觀點和投票傾向。事實在那,我們的工作是完全可靠的,它遵循非常非常高的科學研究標準。

但是現在這位總檢察長給我們提了問題,我們怎麼知道在選舉前夕,搜索結果是否有偏見呢?於是我一頭扎進去研究這個問題,我們怎麼查出來呢?

建立了一個監視系統

因此,在2016年,我建立了有史以來第一個回答該問題的系統。我建立了一個監視系統,你可以將其視為一種尼爾森型(Nielsen)系統。自1950年以來,尼爾森公司就開始招募家庭。這些家庭的身份保密,在他們的允許下,在每家房子裏安裝了一個盒子。公司追蹤這些家庭的成員觀看的電視節目類型。這就是著名的尼爾森評級,該評級決定投入多少廣告費用,決定哪些節目繼續播放,哪些節目被取消。現在全球有47個國家/地區使用,因此該評級公司擁有非常好的方法來解決這些問題。

我創建了一個類似尼爾森型的系統,在24個州有95個實地調查員。我們努力確保他們的身份保密,我們將開發的軟件安裝在他們的電腦上,這些軟件使我們可以在這些人使用電腦的過程中進行監測。當然,這樣做是得到他們許可的。

然後,我們跟蹤他們在谷歌及必應(Bing)和雅虎(Yahoo)上進行與選舉相關的搜索時所看到的內容。這一點很重要。我們在研究三個搜索引擎。我們觀察的這組人是來自24個州的一組多元化的美國選民。然後我們收集數據。數據流每天都傳輸過來。

實際上,2016年5月我們收到了第一組數據。在一段時間以來,我們建立起一支由實地調查員組成的隊伍。選舉前大約25天,我們有一個由調查員組成的完整小組。所以,在選舉前的一個月左右,我們有大量數據流開始傳輸進來。並且,我們保留了13,207個與選舉相關的搜索以及與搜索結果鏈接的98,044個網頁。

那麼,既然我們知道這些調查員看到了甚麼,所以我們知道他們看到的這些搜索結果在甚麼位置。換句話說,我們現在有了可以讓我們確定搜索結果是否存在偏見的數據。為了衡量是否有偏見,我們使用了所謂的「眾包」(Crowdsourcing)。因此,我們使用了互聯網上的一個群體來衡量我們捕獲的網頁中的偏見。我們對網頁有了偏見評級之後,可以為我們保留的搜索結果中的每個搜索位置計算平均偏見。

如何知道某個網站存在偏見?

人們會問,你如何知道某個網站存在偏見?我這個領域的人是專門做這個的。我們已經做了一百年了。通常,我們會給他們一個衡量尺度。在這次的實驗中,我給他們的尺度是從-5(希拉莉‧克林頓)到+5(唐納德·特朗普)。然後,他們查看某個網頁,確定了哪兒存在偏見(如果有的話)。如果沒有偏見,結果就是零。然後,由多人對每個頁面進行評分,我們就有了平均偏見評分。隨後,我們就能夠計算搜索結果中可能存在的偏見。

我們進行的實驗性工作告訴我們,像谷歌這樣的公司轉變人們觀點和投票傾向的影響力。我們有大量來自實際選民的數據,即由24個州的95名選民組成的多元化群體。我們有很多搜索,超過13,000個以及許多網頁。然後開始分析這些數據。

選舉前夕,我們故意將注意力集中在收集數據,故意沒有對數據進行分析,因為如果我們在選舉前發現存在偏見,該怎麼辦?換句話說,我該怎麼辦?我的意思是,如果我宣佈這一消息,那將絕對引起混亂,尤其我認為,如果這個偏見是針對唐納德‧特朗普的。如果我不宣佈這一消息,我將是操縱選舉的同謀。因此,我們專注於數據收集。在選舉之後,我們花了幾個月時間專注於分析。

2017年春季,我將結果提交給了一些科學會議。也就是說,將分析結果提交給了同行評審。當結果被一個會議接受後,我聯繫了一位《華盛頓郵報》的記者。

谷歌所有10個搜索位置都偏向希拉莉

我告訴他我們做的研究,然後說,我們發現谷歌的搜索結果首頁上,所有10個搜索位置都偏向希拉莉‧克林頓,必應或雅虎卻沒有。這又是很重要的一點。我們發現谷歌有偏見,而其它搜索引擎沒有。此外,我們還發現,不僅藍州的人們看到了這種偏見,紅州的人也看到了親希拉莉的偏見。

我們還採用標準的統計技術來檢查我們的發現是否重大。我是說在統計學的意義上,我們的發現非常重要。對於那些知道一定統計學的人來說,我們的發現很有意義,不是在0.05的水平上。人們通常用0.05作為截斷值。而是在0.001的水平上,亦即僅憑偶然獲得此水平的偏差的可能性小於千分之一。

當然,到這一步的時候,我在公開宣佈時遇到了一些新的阻力,因為我等於在說谷歌搜索結果存在很大的偏見。在選舉前的幾個月內,很多人看到這種搜索結果。

這會對選票產生甚麼樣的影響?我進行了一些計算,這些計算是基於我在《美國國家科學院院刊》2015年的論文中的方程式。根據這些計算,我得出的結論是,如果谷歌搜索結果在全國範圍內都存在這種程度的偏見的話,那麼將操縱260萬至1040萬選票支持希拉莉,我本人是希拉莉的支持者。

換句話說,我的科學發現以及通過監視項目得出的發現在某種程度上有損我自己的政治偏好和政治傾向。但是我強烈認為由於我們的結果如此清晰,以至於我有責任公佈調查結果。當然,國務卿克林頓以超過280萬選票的優勢贏得了普選。她選舉失利是因為輸在了選舉人票上。但是我的研究和監控項目表明,如果谷歌的搜索結果沒有偏見,普選結果可能有很大不同。這可能是一場非常接近的競選。

再說一次,我不得不承認這一點,不得不宣佈這一點,這讓我感到不舒服。但這就是我從研究中得出的結論。

谷歌控制約90%的搜索 似乎偏愛希拉莉

你可能會問,谷歌真的會產生如此大的影響嗎?答案是肯定的。美國人每天用谷歌搜索約為5億次。谷歌控制著大約90%的搜索。第二大搜索引擎必應控制著大約2%的搜索,影響不大。還要記住,我們只是在谷歌上發現了這種偏見。谷歌似乎出於某種原因偏愛希拉莉‧克林頓。

當時谷歌作出回應,稱這僅僅是用戶與我們的算法進行交互的方式。我們沒有刻意做任何事情。最終,數年後,在沒有指出我的方法有何具體不足的情況下,谷歌開始對我的方法質疑。最初他們說,這是一種自然效應。谷歌經常用這個術語來歸咎於算法中發生的問題。

在我看來,這完全是胡說八道。我從十幾歲起就開始編程。我可以告訴你,當我們編寫程序時,編程序的目的就是希望它們完全照我們的指令做。事實上,谷歌完全可以控制此類事情的發生,比如說有很多用戶觀點偏左或偏右。算法可以按照它被編寫的任何方式進行回應。因此,我根本不認為這僅僅是算法的錯誤或用戶的錯誤。對我來說完全是無稽之談。

請記住,我們發現的數字(儘管非常清楚)在某種程度上無關緊要。我們做了一件非常了不起的事情。我們保留了谷歌內部所謂的「短暫體驗」。要了解來自大型科技公司對我們的威脅的性質,這是關鍵。

谷歌最近發生的洩漏事件之一是,2018年從谷歌洩露到《華爾街日報》的事件。谷歌工作人員在一封電子郵件中說,我們如何利用「短暫體驗」來改變人們對特朗普移民政策的看法?這是來自公司內部的電子郵件。

換句話說,谷歌了解「短暫體驗」的巨大影響力。「短暫體驗」究竟是甚麼?它是指你輸入了一些內容,例如搜索一個詞,於是一些結果會特意為你即時生成。它們影響你,然後消失不見了。而且它們不會存儲在任何地方。你無法再回去找到它們。你無法重建這種體驗。你剛才的那個經歷是獨一無二的。因此,這是一種絕佳的操控人的方式。

楊傑凱:沒有留下任何記錄。

愛潑斯坦:沒有記錄,你回不去,人們甚至看不到偏見。這是我們從不斷的研究中發現的。只有極少的人能在搜索結果中發現有偏見。而讓人不寒而慄的是,能夠看出偏見的極少數人,反而更傾向於朝偏頗的方向走得更遠。

楊傑凱:這本身是個了不起的發現。

愛潑斯坦:確實如此,我對這些事情的研究越多,對它們的了解也越來越多,而我也變得越來越擔憂,因為這些都是前所未有的極其強大的技術。隨著我意外地發現了它們一個又一個,我不得不給它們命名,因為它們是有了互聯網之後才可能會有的。它們也不同於其它影響力來源。

在選舉中,我們受到廣告牌、廣播、電視和宣傳廣告等的影響。所有這些都是競爭性質的。從這個意義上講,這可能是一件好事。對於民主來說,這是一件好事,因為有如此多的競爭在吸引您的注意力,並試圖說服您。

即使可以估量出,卻也無法抵消這種偏見

但是,如果搜索結果存在偏見,被操作平台(在本例中以谷歌為例)控制。那就沒有競爭,谷歌擁有100%的控制權。當然,即使你可以估量出,卻也無法抵消這種偏見。即使你可以估量這種偏見,也無法抵銷它。

第一,你必須能夠看出它;第二,必須能夠有衡量辦法;第三,捕捉到它;然後呢,你如何應對呢?你無法更改谷歌算法的操作。因此,這裏存在著很多危險,但是看出問題是開始,然後引起其它發現。但是我們的基本想法是,我們的程序可以非常準確地告訴我們像谷歌這樣的公司擁有怎樣的影響力,改變人們觀點和投票傾向,還不只是谷歌,還有其它新興的科技公司。

楊傑凱:擁有龐大的用戶群的這些公司。

愛潑斯坦:是的。我們現在有了一套監視系統。我在2018年建立了第二個系統,有160多個實地調查員,這次保留了超過47,000個與選舉相關的搜索和近40萬個網頁。我要申明,在每種情況下,我們使用的搜索詞都是無偏見的,這非常重要。我們有獨立的評估者對我們使用的搜索詞進行評估。之所以如此重要,是因為如果我們使用有偏見的搜索詞,例如「邊境牆是個好主意」,那麼我們當然會得到有偏見的結果。但是事實上,我們使用無偏見搜索詞,如:「告訴我有關邊境牆的信息」。

楊傑凱:或者是「告訴我候選人的名字」之類的。

愛潑斯坦:正確。我們使用無偏見搜索詞就會得到無偏見的搜索結果。想一想,搖擺選民會輸入甚麼搜索詞?他們會輸入相對中立、無偏見的詞,不會輸入「建邊境牆是個好主意」。他們會輸入「告訴我牆的信息」或者「建牆是個好主意嗎?」他們會輸入中性搜索詞。

如果谷歌存在偏見 或轉移數百萬選票

我們在2016年和2018年的選舉中都發現了偏見,即使使用中性詞來搜索都會得到偏向自由派的結果,這確實令人不安。

楊傑凱:在2018年的調查中,估計會有多少選民可能因此改變投票對像?

愛潑斯坦:2018年是中期選舉,我們必須採取截然不同的做法。我們集中在南加州的三個共和黨選區,這些選區都位於堅定的支持共和黨人的橙縣。事實上,羅納德‧列根(Ronald Reagan)曾經有句名言:橙縣是老共和黨人終老的地方。所以這些是共和黨選區。我們將監控重點放在了這些地區。

我們再次很容易地在所有三個地區中發現了明顯的親自由派偏見,這足以說明發生了甚麼。因為這三個地區的議員最後都由民主黨人當選。在那些地區,搜索結果非常親民主黨候選人。而且我們計算得出,如果谷歌在全國範圍內都存在這種偏見,順便說一下,這三個地區的自由派偏見只發生在谷歌上,必應和雅虎沒有。

如果在2018年全國範圍內與谷歌選舉相關的搜索結果中存在這種偏見,我們計算得出將轉變7820萬選民的投票。現在聽起來這個數字不可能,但是您必須記住……

楊傑凱:是的,聽起來太離譜了。

愛潑斯坦:是的、是的。但是您要知道,這分散在成百上千個選舉中。因為這是一次中期選舉,所以包括州、地區和地方選舉。因此,7820萬是我們認為可能改變選票的上限。這些選票散佈在許多選舉中,但是,這個結果仍然令人不安。

偏見會影響人們對候選人的看法

楊傑凱:我想到一個問題。根據您的早期研究,我們可以在監控項目中明顯看到偏見會影響人們對候選人的看法。但是,如何確定人們在實際投票時的行為又如何呢?

愛潑斯坦:這是一個很好的問題,我希望有更多的人問我這個問題,因為我看過提出這類問題的文章,該文章認為我並沒有真正發現任何東西。事實是,我們非常確定,我們的發現會體現在人們實際的投票中,這有幾個原因。

首先,我們可以從一項廣泛的調查研究中了解到,如果你問人們將投票給誰,這已經基本預測了他們將實際投票給誰。雖然會有個別例外情況,但總的來說,我們所說的預測準確率為90%到95%。然後,會有投票後的民意調查。通常這個調查會非常非常準確。偶爾會有例外,這我承認。

但是,還有其它一些原因使我們相信,我們的發現不僅是正確和準確的,我們甚至低估了有偏見的搜索結果對人們實際投票的影響。我之所以這樣說,是因為首先,在我們大多數的實驗中,人們只進行一次在線搜索,而我們仍然發現這很大程度影響了他們的傾向。現實生活中是甚麼樣的呢?在現實中,人們會在數周或數月的時間內進行與選舉相關的許多搜索。如果是搖擺選民,他們會一次又一次地受有偏見的搜索結果影響,將他們帶到偏向於某位候選人的網頁上。如果人們一次次地看到有偏見的搜索結果,會發生甚麼?

事實上,我們做了一些實驗來專門研究這個問題,並且發現如果我們讓人們看一次有偏見的搜索結果,我們就能影響他們。如果我們再讓他們看第二次有偏見的搜索結果,當然我們不會給他們看相同的搜索結果,而是給他們看具有相同偏見的結果,那麼這種影響會增加。如果我們給他們看第三次,他們就被影響得更多。

搖擺選民數十次、數百次受到有偏見搜索結果的影響

因此,您可以想像一下到底在發生甚麼。實際發生的是,搖擺選民在很長一段時間內不止一次、兩次、三次,而是可能數十次、數百次地受到有偏見搜索結果的影響。這意味著我們在實驗中發現的結果極可能低估了像谷歌這樣的公司對選民的真正影響。

楊傑凱:難以置信。在您描述所有這些內容時,我在想像這種情況……因為您打算進行另一個監測項目,我希望您稍後跟我們說一說。這次監測,您不會等到選舉後才透露監測內容。我可以想像會出現您剛才描述的那種混亂。請談一些有關此監測項目的情況,以及如何處理整個局面。

愛潑斯坦:我們希望在2020年推出更具規模的監測系統。可以說2016年的系統只是探索性的。這種事情以前從未做過。坦白說,無論我們獲得多少統計數字,我們做這件事情的本身我認為是值得一提的。我的意思是,我們找到了一種以有意義的方式保存相當大規模的短暫經歷的方法。

但是,到2020年,我覺得科技公司會肆無忌憚這樣去做。他們2016年非常謹慎和過份自信。他們可以做很多瘋狂的事情來改變選民的投票傾向,但他們之前沒有這樣做。但是2020年,我們預計在數月時間裏,將會有很多很多的操縱手段和利用各種短暫經歷去影響選民。

我們計劃建立一個更大的實地調查員小組,在所有50個州中至少要有1000人。這次,我們計劃使用人工智能(最近幾個月我們一直在為此努力)實時分析每天收到的大量數據。

這意味著,如果我們發現存在偏見或某種操縱的證據,我們將予以公佈。一旦證據確鑿,立即公佈。或者向媒體,或者向聯邦選舉委員會或其它當局公佈。這勢必將造成混亂,但這是我們需要的一種混亂。基本上,我猜這些公司或我們已經確定的公司將會反擊。

但是也可能有好的結果。一種可能是這些公司……我們稱其為作惡者,作惡者也許會退縮。如果這些公司退縮,如果他們停止使用這些技術,那麼我們將有自由而公正的選舉。如果他們不退縮,而我們繼續發現並確認大規模操縱投票的證據,坦率地說,我認為這些公司將付出慘重的代價。我認為可能既有針對他們的民事訴訟,也可能有刑事訴訟。

設大型監視系統實時識別詭計 讓科技公司住手

無論哪種方式,我認為民主必勝,這是我關心的問題。我不關注任何特定的政黨或候選人,儘管我本人偏左。我關心的是民主和自由公正的選舉,因為你不知道這些對公眾不負責的私營公司如何運作,你也不知道他們將如何利用他們擁有的這些影響力。毫無疑問,他們擁有這些影響力。就目前而言,起碼我個人認為,這些影響力正在被利用,這是毫無疑問的。

這些公司最近洩漏的一些材料進一步證實了這一點。一些內部人士亦即告密者挺身而出,並說公司實際上在故意操縱人們的觀點、思想和投票偏好,並且在大規模地這樣做。

關鍵是,如果我們擁有一個大型的監視系統,並且實時地識別一個又一個詭計,那麼這些公司很有可能就此收手。底線是確保自由公正的選舉。當然,除此之外,由於這些公司可以改變對任何事情的看法,因此我們需要密切注意這些公司還在做些甚麼。同樣,這需要監視系統。

我想我們考慮的範圍應不限於美國,因為像谷歌這樣的公司正在影響全球20多億人。在三年內,這個數字將激增至40億以上。因此,谷歌在全球範圍內都擁有這種影響力。它切實可以影響人們的思想、行為、態度、信念、甚至幾乎每個國家的選舉。在我看來,這意味著要建立更大、更好的監視系統,以密切關注谷歌等公司。我認為,這不僅對於保護全球民主是必要的,對維護人類自主權也是必要的。

楊傑凱:我想談一談其它一些方法。實際上,您9月在《大紀元時報》上發表的一篇文章中就報道了這些內容。您提到有10種方法,不僅(針對)谷歌,還有其它大型技術巨頭。在那之前,我想講另一件事。較早時我們談到谷歌前資深軟件工程師弗希斯(Zachary Vorhies)洩漏事件,我們請您對他洩露的內容進行過評論,您說了一些令我深感不安的事情,我想在這次採訪中簡要地探討一下。您說過,如果是算法本身得出的這些偏向結果,而不是人為地使用類似twiddler的工具(我相信是這樣的叫法)對結果進行重新排名,會讓您感到更加不安。在我們探討其它一些方法之前,您可以簡單地談談嗎?

愛潑斯坦:好的。最近我人生中較為矚目的一件事情,就是特朗普總統發出了一條推文提及我的研究,雖然他沒有提及我的名字,不過這顯然是我的研究,因為我剛剛在國會作證。他發文說,這份新報告顯示,谷歌操縱了2016年大選,讓希拉莉·克林頓多了2百萬至1600萬張選票。他說的數字稍微不太準確,但他也把操縱的概念理解錯了。我從未說過谷歌操縱了選舉。

操弄搜索結果 公司高管還是亂來的員工?

我承認我曾經一門心思想要知道是像谷歌這樣公司裏的高管,還是說只是某些亂來的員工在操弄搜索結果和搜索建議以及其它內容、YouTube影片等等。有一段時間,我醉心於想要了解他們是否是故意的。谷歌員工是故意的嗎?後來我終於意識到,我不在乎了。無所謂了,我們姑且假設他們不是故意的,只是沒有注意到這個問題。

想一想。他們正在影響全世界的思想和行為以及投票。我和妻子在斐濟群島住了一段時間,斐濟90%以上的搜索都是使用谷歌。我們住在那兒時,是一個軍事獨裁政權統治。但是我們離開後那裏進行了選舉。

現在的問題是,谷歌會注意這一選舉嗎?我們姑且說他們一點也不在乎斐濟的選舉。他們沒注意。假設許多國家的事情他們不在乎。對於許多選舉,可以說他們不在乎。但是該算法仍將繼續發揮作用。它始終將一種狗糧放在另一種狗糧之前,將一個品牌的牙膏放在另一個之前,將一個候選人放在另一個候選人之前。程序就是這樣設計的。

谷歌的搜索算法沒有對等時間規則。在進行實驗時,我們總是有一個對照組,將結果混合排列。因此,沒有偏見。但他們沒有這樣做。他們的算法旨在告訴你甚麼是最好的,並將最好的排在首位。如果你猶豫不決,排在首位的搜索結果會改變人們的想法和觀點。

因此我意識到,當今許多重要歷史事件不是由像谷歌這樣的公司制定計劃、目標和戰略所決定的,而是由電腦程序決定的。對我來說,這遠比谷歌高管要統治世界要可怕得多。事實是,我們製造出了這種能影響全人類的強大電腦算法,並聽之任之。

程序員的意識形態偏見 會被納入算法

楊傑凱:您之前說過這點,當時我聽得毛骨悚然。您現在又說了一遍,我又聽得後背發涼。首先,大量研究表明,程序員的意識形態偏見會被納入算法。那可能需要在另一次訪談專門來探討。但是谷歌如何抵消這種影響?假設他們決定以您希望的方式作出回應,但是要如何做呢?他們是否必須對搜索進行重新排序,以免出現偏見?這是如何運作的?

愛潑斯坦:幾個月前,我可能對這個問題會支支吾吾,但是現在不必如此了,這要感謝告密者弗希斯,感謝他從谷歌拿出公佈的一些文件。事實是,谷歌可以輕鬆解決搜索結果中的政治偏見。我是怎麼知道的呢?因為谷歌一直以來都在關注這種它們內部稱為算法不公平的問題,這個問題可能導致所謂的算法困境。所以谷歌開發了一些控制算法不公平的方法。他們開發了叫做「機器學習公平性算法」(ML Fairness Algorithms)。

我大致介紹一下該方法的工作原理。假設你正在谷歌上瀏覽圖片,然後輸入CEO(我最近試過),你會主要看到男性的圖片,因為絕大多數美國的CEO是男性。這正是某些人稱谷歌的算法不公平的一個具體例子。即使目前大多數首席執行官都是男性,這一事實可能會使某些人感到不快。

因此,他們開發了非常簡單的方法來彌補,這樣當您輸入CEO時,您會看到一半是男性,一半是女性。天才呀,當然,這不一定符合真實情況,可以被認為是一種社會工程(social engineering),因為它製造的印象並不完全符合真實情況。而且,當然,如果你把這種邏輯應用於社會的許多不同方面,則你可能在進行大規模社會工程,或可能被指控在從事大規模社會工程。

撇開這個問題,我要說的重點是,谷歌有能力消除任何可能的政治偏見。他們可以很快做到,也許一天之內就可以。這就是為甚麼我在想,如果我們通過大型監視系統暴露各種偏見,就像我說的那樣,公司可能會退縮,他們可能會使用已經開發的技術,即所謂的機器學習公平性算法來彌補這個問題。下次我們尋找偏見時,甚麼也找不到。消失了。

楊傑凱:十分吸引人的議題。您不但概述了問題,還提出了可能的解決方案。這在我們的採訪中很少見的。請介紹一些目前使用的其它方法。我們一直在談論谷歌和搜索引擎的操控問題。當然還有許多其它方法。比如另一個大型互聯網平台臉書又如何呢?那裏在使用甚麼類型的方法?

大選前提示參選 會影響選民投票意識

愛潑斯坦:臉書至少有五種影響人們意見和投票傾向的方法。我最早是在2016年寫過這類文章。他們最簡單的方法稱為定向消息傳遞。我在一定程度上研究和量化過這個問題。我稱之為「TME效應」,即「目標消息傳遞效應」。舉個最簡單的例子,順便說一下,這是基於臉書2012年自己發佈的數據。

如果在2016年選舉日,馬克·朱克伯格(Mark Zuckerberg)決定僅向民主黨選民或偏左的選民發送「去投票」的提示,那一天希拉莉‧克林頓的投票數將比她當天實際得票多至少45萬。那麼,因為馬克‧朱克伯格偏左,我懷疑他可能因為沒有想到要發出針對性的信息而懊惱不已。但關鍵是,他有能力那樣做。定向消息傳遞有非常強大的影響力。

還有一個例子跟它差不多。在2018年,谷歌確實在其首頁上發佈了「去投票」的提醒。他們從主頁上刪除了彩色的「Google」(谷歌)一詞,並換上了「Go Vote」(去投票)一詞。如您所知,我發表了一篇文章,其中包含所有計算結果,文中表明如果這個投票提示發送給每個美國人,那麼會有更多人投票,否則這些人將待在家裏。但是由於使用谷歌的人群分佈的原因,民主黨獲得的票數將比共和黨獲得的票數多80萬。聽起來像是很多選票,但這是中期選舉。因此,這些選票分散在數百個選舉中。儘管如此,這還是有利於民主黨。毫無疑問,在谷歌發佈提示之前,谷歌的數據分析師所做的計算與我的計算相同。

如果谷歌將該提示主要顯示給民主黨人,或者顯示給左傾或偏左的人,那麼將產生更大的影響。在極端情況下,民主黨獲得的選票將比共和黨獲得的選票多出460萬。這是另一種效應。我們稱其為「DDE」或「差異人口統計效應」。正如我之前說的,我一直偶然碰到這些現象,並且一直在努力嘗試理解它們並對其進行量化。

但是,大多數這些影響類型在人類歷史上從未發生過。互聯網使它們成為可能。這些科技巨頭壟斷使它們成為可能,而它們完全掌握在這些科技壟斷企業的手中。換句話說,你無法抵消它們。即使找到了它們,也無法抵消它們。

楊傑凱:因此,您建立了這個龐大的監視系統。您成功了。有至少一千甚至更多人在研究搜索引擎的操縱效應。我們有沒有可能無法發現DDE或其它效應?

愛潑斯坦:當然。到目前為止,我已經確定了大約12種效應,例如SEME,DDE和TME。但是可能還有其它。肯定有其它方法。我的意思是,我不可能……我只是一個人研究。到目前為止,我是唯一一個一直努力去發現這些效應並對其進行量化和研究的人,事實上,我是唯一一個設置監視系統來捕獲短暫經歷的人。這令我覺得很奇怪。我不明白。這需要有所改變……到2020年,將非常棘手。如果只有我和我的同事收集所有這些數據,會產生影響嗎?這會改變甚麼嗎?

楊傑凱:您的意思是,需要有多個獨立的實體來發現相同或可能不同的結果,是嗎?

愛潑斯坦:確實如此。確實應該有很多像我這樣的人,他們應該在不同的機構展開這樣的工作。政府、非牟利組織、大學裏都應該有人在從事我做的這種研究。我猜想,如果在2020年我們有一些驚人的發現,並且我們做事認真、可信,並將我們的數據移交給合適的主管部門和專家,我想會帶來一些真正的改變。我希望。

楊傑凱:愛潑斯坦博士,了不起的工作,非常感謝!

愛潑斯坦:謝謝。#

------------------

🏵️《九評》20周年
https://hk.epochtimes.com/category/專題/退黨大潮

🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand