(1)
到陌生都市的游客,駐足街頭尋找餐館時,常常面臨這樣一個問題:
一家餐館人滿為患,熱鬧非凡; 隔壁另一家餐館門可羅雀,只有兩三個食客.
在沒有其它更多信息的情況下,該到哪家餐館吃?
如果你像大多數人一樣, 答案是:選擇那家人多的餐館.
因為你沒有能力迅速判斷哪家餐館更好,而其他人的選擇,成了最可靠的指南.
這種行為模式的后果是,擁擠的餐館生意越來越好. 人少的餐館則長期蕭條,倒閉的風險更大.
世上多有自命不凡者,為標榜自己的與眾不同,常常不屑的評論同類說, “ *國人就是浮躁,愛扎堆!”
模仿/抄襲其他人的行為方式,究竟是愚蠢淺薄,還是聰明實用? 不愛扎堆,特立獨行的個體,是否真的比愛扎堆的個體,有更多進化優勢?
(2)
2007年,英國 St Andrews 大學的進化生物學家 Kevin Laland,決定通過公開懸賞一萬英鎊的方式,給這個問題尋找一個科學的答案.
他給全世界的學術界同仁發公開信:
“假設你在一個陌生的環境里,不知道哪里有好吃的,不知道如何從點 A到點 B,你會花時間自己調查呢,還是觀察模仿其他人?如果模仿,你會模仿誰?你看到的第一個人嗎,還是最常見的行為方式?你總是模仿呢,還是選擇性的模仿?”
競賽的規則,是以所謂的“多臂賭博機”(multi-armed bandit) 的數學模型為基礎. 賭博機,也叫老虎機,賭徒在投擲硬幣后,轉動其把柄 (就是所謂的 “臂”)后, 馬上可以看到自己的回報.
參賽者每一個回合的行動,可以有三個選擇: 觀察,探索和開發.
觀察, 就是看別的參賽者的行為 (撥動了哪個老虎機?) 和相應的回報, 記錄下來.
探索,就是隨機嘗試探索別的行為(老虎機)和相應的回報,記錄下來.
開發,就是在自己記錄下來的策略中選擇,直接撥動一個老虎機,獲得相應的回報.
每個老虎機的回報,不是完全固定,而會隨時間推進,有一定幾率會改變.
只有選擇“開發”的行為時,才可以真正獲得回報。參賽的程序,必須制定策略,分配多少時間去開發,探索或者是觀察。參賽者,每個回合都有可能死亡,而其過去每個回合的平均回報越低,死亡被淘汰的概率就越大.
包括Laland 在內的大部分學者,在比賽開始前,預測勝出的策略,將會是模仿和探索的這兩種學習方式的結合.
來自十六個國家的 104個參賽者,提供了他們的競賽程序。經過一年多,兩個階段,幾十萬個回合的廝殺,來自加拿大的兩個年輕研究生提交的一個叫做 discountmachine 的算法,意外地獲得第一名.
(配圖來自 Rendell 和 Laland 2010年四月發表在“科學”雜志上的論文,"Why Copy Others?")
discountmachine 的策略,以“觀察”為主,幾乎完全不用“探索”的學習方式。即便在競賽主持者調節各種環境參數后 (改變環境變化速度,改變觀察信息失真或者無效的幾率,改變可觀測的其它個體的數目), 這個策略仍然在絕大多數情況下輕松擊敗其它對手.
事后分析,“觀察”,作為一種社交學習方式,它的本質優勢在于,觀察到的社會其它成員的行為,有較大的幾率是回報最高的選擇,所以值得模仿。這種優勢在相對穩定的環境里尤其突出。而“探索”獲得的回報,統計平均上會趨于平庸,不利于建立進化優勢.
唯一的例外,是環境變化速度極快的情況,這意味著老的行為模式的回報隨時間流逝變化很大,簡單的模仿抄襲完全喪失了價值.
生物界的扎堆現象,原來不是天生如此,而是進化淘汰的自然結果。那些總是特立獨行者,大多很快耗盡自身資源而早夭。
(3)
美國學者,前哥倫比亞大學教授,Duncan Watts 2006年曾經做了一個實驗:
他從網上召集了一萬多名少年測試者,給他們一組 48 首不知名的歌曲的清單,觀察他們下載試聽歌曲的行為。測試者可以先試聽音樂,然后決定是否下載歌曲。測試者分為兩組,一組知道每首歌曲其他多少人下載 (A組), 另一組則什么都不知道 (B 組).
沒有多余信息的 B 組,48 首歌曲下載的分布是這樣的:
(配圖來自 Peter Ormerod 的著作 "Positive Linking", 下同)
不同歌曲, 下載數目差別不大. 如果把中位數設為 100,下載數從 175 到 50以下,均勻分布.
而 A 組, 下載的分布是這樣的:
排名第一的歌曲的下載數是 350, 第二名是 200, 最后一名歌曲的下載數不到 10,除了前三名以外,其它所有歌曲下載數都低于100,而一半以上的歌曲下載數不到30 !
公開透明的信息,使個體迅速模仿他人的選擇。模仿的結果,則是市場份額急劇向前幾名傾斜。前幾名吃肉,其他人只能喝湯.
這個現象在網絡時代尤其突出. 美國有統計數字顯示,谷歌搜索使用者 98%都只會點擊前面三個搜索結果,而第一個搜索結果會得到 60% 的點擊. 如果你在搜索結果排行前三名之外,不要說肉,連湯也很難喝上了.
(4)
進一步觀察歌曲下載數的細節時,Watts 和他的團隊又有新的發現:
歌曲下載數目的相對排序,兩個對照組之間,并沒有很強的關聯。有更多信息后,最大的改變,來自于誰變成了第一名,誰變成最后一名。原先最熱門的歌曲變得冷門的概率很小,最冷門的歌曲變得熱門的概率也很小.
但是其它各種情況都有可能. 原先排名中間的歌曲,可能突然變成頭牌,但更可能的是,排名跌倒最后,無人問津.
這個現象的后果讓人不禁打了一個激靈:
一些行業涌現出來的成功者,很可能是因為這種個體模仿的網絡效應所致. 其產品特性, 往往并不是最優秀的.
但成功者可能錯誤的把成功歸因于產品特性。失敗者則沒有研究如何正確利用網絡效應,而是開錯了藥方,繼續埋頭研究如何提高產品特性,但這并沒有什么卵用。失敗者長期陷入 "失敗 - 開錯藥方 - 繼續失敗 - 繼續用錯藥"的痛苦怪圈內苦苦掙扎,無法自拔.
(5)
實際上,對于群體抄襲模仿的行為導致的正反饋現象,匈牙利數學家波利亞 (George Polya) 早就提出過所謂 “波利亞罐子模型 (Polya Urn Model)”的問題。這個罐子模型的一個例子是:
有一個罐子,裝滿紅色和綠色的球。紅球和綠球的數目一樣, 50/50。假設我們每次從罐子里隨機拿出一個球,然后再把這個球和另外一個相同顏色的球放回罐子里.如果我們不斷長期重復這個過程,最終罐子里的球的顏色分布會是什么樣子的?
英國經濟學家 Brian Arthur 和幾名同事在 1983 年的論文里,計算分析這個例子得出的結論是:
1) 給足夠長的時間,最終這兩個不同顏色的球的比例,將會接近 100:0.
2) 最開始很難預測是紅球,還是綠球會勝出. 受各種偶然因素影響, 都有可能.
3) 勝出者在過程的早期就會涌現.
4) 一旦領先,很難反轉.
這里的關鍵是: 事先無法預測誰是勝者, 但在早期勝者開始涌現, 趨勢不可逆轉時,應果斷加倉, 順應趨勢.
(6)
西班牙服裝品牌 Zara, 采用的就是這種策略。他們意識到對于未來幾個月流行服裝款式的預測,他們其實不比別人強。大部分時裝品牌公司, 試圖預測下一季流行的款式,但一旦預測失誤,大批服裝在店里滯銷,損失慘重.
Zara 派人定期到各個大規模購物中心,觀察消費者的穿衣樣式。再根據這些數據,設計大量各種款式,衣料和顏色的服裝組合,隨后迅速生產出小批量的成衣,送到零售店.
零售店的銷售數據,馬上可以告訴他們什么款式賣得好. 他們再據此信息, 迅速大規模生產賣得好的款式. Zara 可以在兩周內, 完成對新款服裝的設計/生產/運輸/銷售,覆蓋全世界的所有角落.
Zara 的創始人,Amancio Ortega, 2017年三月時身價高達七百億美元,是歐洲首富.
抄襲模仿,是導致強者益強的唯一因素嗎?
落后者,難道就永遠沒有機會翻盤嗎?
如何以弱勝強?
何時需要果斷止損,退出放棄一個市場?
且聽下回分解.
地址:中國·合肥市高新區創新大道5089號中科大先進技術研究院一號嵌入式研發樓4F
400-168-9850
皖公網安備34019202000142號版權所有 ? 安徽天恩信息科技有限公司 皖ICP備15021665號-6
建筑行業信息化軟件服務提供商智慧工地整體解決方案服務商做建筑行業數智產品領跑者