返回索引页

【基礎科研】什麼是科學?

2014-10-16 17:55:00

原文网址:https://blog.udn.com/MengyuanWang/108908650



我這輩子做了兩個專業,第一個是高能物理,結果目睹了它被超弦這個偽科學取代的過程;後來改行做金融和經濟,結果發現美式的經濟學比超弦更離譜,完全成爲資本利益集團的宣傳部門。因此我對什麼是真科學、什麼是偽科學有些興趣。這個問題屬於哲學的範疇,做理工的一般不會接觸到;我當然也不是專家,這裡只是簡單地說說我所理解的資訊。如果解釋得不對,歡迎更正。

最常被引用,也是最古典的定義,是奧地利哲學家Karl Popper在1930年代所提出的。他認為科學是一個正式的邏輯系統(Interpreted Formal Logic),科學的發展過程就是不間斷地企圖來駁斥(Refute)這個系統的構件,所以真科學和偽科學的差別在於前者是可以用實験駁斥的(也就是“證偽”,“Falsify”。請注意Popper的定義只說“證偽”而不是“證實”,因為再瘋狂的妄想能。

Karl Popper,二十世紀的知名哲學家和思想家;生於1902年,卒於1994年。學術生涯主要任教於英國首屈一指的倫敦政經學院(London School of Economics)。

原本超弦早期(1980、1990年代)的問題在於它是建築在幾十個可能性無限小的假設上的,這些假設的真正辯護(Justification)是方便作者做計算,做了計算才能寫論文。我當時就覺得這些論文是為了出版而出版,它們是正確的可能性比那個作者當場被隕石打死的機會還要小很多;只不過那個可能性不是數學上的零,所以超弦雖然是糟糕的科學,還不能確定為淪落到偽科學的地步。等到Peter Woit開始寫他的部落格的時候,超弦界已經預測出10^500個不同的宇宙(10^500是多大的一個數字,一般人很難想像,讓我給幾個用來比較的例子吧。一個人的體重大約相當於10^28個氫原子,地球的質量大約比一個人大10^23倍,整個宇宙大約比地球重10^29倍,所以宇宙頂多只有10^80個原子。那麼超弦就當然不可能被任何實験來駁斥,於是Woit可以論斷超弦在Popper的定義下是一個典型的偽科學;做超弦的人也因此對Woit本人和Popper的定義恨之入骨。

其實哲學界自己對Popper的定義也有些意見:主要是Popper描述的是一個理想化的科學界;真實的世界裡,大部分的科學家還是把自己的論文當寳貝的。而科學的進步除了以實験來駁斥舊理論以外,發明新理論應該是一個至少同等重要的過程。因而在1950年代,美國哲學家Thomas Kuhn提出一個新的定義:科學是由互相競爭的理論體系(Paradigm)所構成,每個體係不斷地提出新的謎題(Puzzle),然後解答這些謎題。 Kuhn認為偽科學是提不出或解不出謎題的體系。

Kuhn的理論有很大的毛病:他的定義基本上描述的是所有現實中的學術研究機構。所謂的謎題和解答,定義很含糊,不只是科學和偽科學可以輕鬆地不斷提出謎題和解答,連明顯不是科學的學術科目也可以做得到。因此Kuhn的理論並沒有被哲學界廣泛接受,不過他至少啟發了匈牙利裔的哲學家Imre Lakatos的真偽分辨準據(Demarcation Criteria)。 Lakatos綜合了Popper的實験檢驗標準和Kuhn的新理論解答,而定義了所謂的進步學術(Progressive)和退步學術(Degenerative):能預測到出人意料的實験結果(Novel Facts)的叫進步,預測不出或者預測錯誤的叫退步。在互相競爭的理論體系中,最進步的是真科學,有點進步的是科學假設,完全退步的是偽科學。依照Lakatos的真偽分辨準據,超弦仍然是典型的偽科學。

Imre Lakatos,數學家和哲學家。生於1922年,死於1974年;1960年起任教於倫敦政經學院,得以與Karl Popper共事。本圖裡的西班牙文是這個意思:「科學家臉皮很厚,往往被現實證明是錯了之後還要耍賴」。用在做超弦的人身上,極為妥切。

那美式的經濟學算是什麼呢?美國的經濟學家不但不管事實結果,連理論的內容都處處違反邏輯。經濟學家的地位,不在於他的理論的實踐結果如何,也不在於他所做的假設和結論是否合理,而在於互相選美的知名度(Celebrity)競賽。所以諾貝爾經濟學獎有時在同一年發給兩三個同一題材內的“大師”,而他們的理論卻南轅北轍、互相矛盾。這様的學術,連偽科學都談不上,純粹是宣傳洗腦的工具。

【後註一,2025/04/19】有朋友私下來信,針對最新的《龍行天下》節目(參見《美國的關稅、中國的冷靜,哪一個讓世界更震驚?》)做出批評質疑,我覺得值得作爲這篇正文的參照,所以將問答轉列於下。

<問>說到想早上節目是因為怕說晚了就沒法展現先見之明時(知道您是戲言)覺得真挺失望的,尤其是之後又反复提及如何提前預判什麼什麼事,外人看到難免會想“這就是他的追求?格局也太小了吧?”

<答>我反復强調自己的預測正確,並不是出於傲慢或虛榮,其實是很早以前就在深思熟慮之後定下方針、有意地試圖扭轉文化。你所説的“格局”,本質是拿空洞的内涵來裝逼(亦即“大師風範”);這的確是一門大本事,是在商場和學界勝出的關鍵,但問題在於治國不能這樣搞,否則普選制挑選出來的“人才”,例如Obama這種口若懸河的人,就會是最優的了。別忘了,博客討論的議題,一進一出動輒幾萬億美元,任何犧牲精確度和完整性的婉轉,都是我的良心不容許加諸於國家的潛在損失。

博客的最核心論述,就是治國(亦即博文常説的“管理公共事務”)必須依憑科學理性。什麽是科學的好壞標準?不是看聽衆喜不喜歡,不是看大佬點不點頭,不是看裝逼高不高檔,不是看論文登上哪個期刊,而是要看預測是否兌現(博客不是常説,“事實”比“邏輯”還要優先?檢討預測是否兌現,就是“事實”和“邏輯”的碰撞過程),而且越是事先被主流排斥、事後卻被證實的,越是重要、正確和難得。這個標準對自然科學出身的人,都已成爲本能,但社會科學也絕對應該如此,偏偏當代的社科界完全沒有這個概念,這也正是世界上這麽多政壇的所謂精英卻在政策上極端幼稚的根本源頭。

博客的大目標是爲國建言,主要手段則是通過優質的内容和態度來提升輿論水平,那麽以身作則、倒逼社科學界檢討自己的預測是否正確,不正是最關鍵的文化任務之一嗎?你看十幾年前的網紅學者,全都爲了裝逼、維持你所説的“格局”,從來沒有人會檢驗自己的預測,反正都是錯的;但是今年Trump當選後,就有不止一個知名大佬站出來說我們四年前就預言Trump會“捲土重來”。雖然他們是在狡辯作弊(因爲四年前他們預測的,不是Trump會在2024年當選,而是會試圖重新出來競選的廢話,也就是利用了中文裏“捲土重來”的語義含糊性),卻讓我很高興:中國社科界終於開始接受科學標準了,這是博客11年努力的又一成果。

7 条留言

GUI-龟
2021-05-08 02:35
什么是第一原则(First Principle)

王博士最近的回复里多次提到第一原则。这个词我不太懂,去网上查了一下,发现它近似于欧氏几何里的公理。不过我还是不太明白这个概念:首先,如果定义了一些公理,那么如何保证公理是正确的呢?比如美式经济学的理性人假设就是一个脱离实际的假设。其次,我不太明白日常生活中怎么应用第一原则。我的理解是先确定基本事实(相当于证明题中的初始条件),再从事实出发利用规律(相当于数学中的公理、定理等)逐步推导结论。请问这种推导结论的过程是否符合第一原则?



另外,我还想再问一个方法论问题。王博士批评的简单类比思维,其本质就是归纳法。归纳法是不安全的,最简单的例子就是“猪圈里的猪认为打铃是天降饲料的原因,直到某天屠夫来临”。社科领域问题极为复杂,难以通过实验复现来检验,只能通过历史记录寻找规律。这一研究过程本身就是归纳法(虽然同行之间可以交流,但大家本质还是在用归纳法,顶多只能在基本事实上互通有无),得出规律的可靠性自然要打问号(比如国内流行的“因为自由民主,所以国富民安”观点,就是典型的归纳法结论)。既然规律可靠性要打问号,那么第一段中描述的推导过程也很可能不可靠。那到底该怎么得到可靠的社科判断呢?



PS:我搜索第一原则的解释时,发现它在物理学中有许多应用,但我的物理水平只是用课本里的物理规律解题而已,从来没有接触过第一原则的应用。

First Principles指的是極爲基礎、可靠性全無疑義的已知事實。回歸第一原則的意思,就是不在假設上再加假設,頂多只有一層不確定的前提考慮。世界上有趣的議題,很多無法完全確定,所以討論最可能或最優結論的時候,也必須估算誤差。如果纍積了多層假設,這個估算就幾乎必然會是錯的。

在自然科學裏,若是把假設拿來冒充為已確定事實,層層堆砌,像是超弦,就自然演變成爲僞科學。在社科上,因爲美宣對維持霸權有重要作用,這樣的冒充頂替更是有長久的歷史和充分的資源,被系統化和普世化了。例如美國人假裝直選制是普世價值,就不是第一原則;如果貿然接受作爲前提,後續討論就毫無意義。我從演化論去討論真正普世價值的特性,才是從第一原則出發。



“從演化論去討論真正普世價值的特性”,我在過去兩個月就提過兩次。留言回復你不用心讀,只管發自己的問題,嚴重違反博客規則,那則留言被刪了,禁言一個月。
2021-05-09 09:02 回复
yyds
2021-12-14 17:02
自然科学是基于严格的统计学实验,推导出的理论,必然是可证伪的试错科学,但要考虑实验误差对结果的干扰,其中数学>物理>化学,后者公式是前者的近似模型,有严格的逻辑推导,社会科学确是归纳学,基于历史经验总结,逻辑源于自然演化(进化论、博弈论),归纳不具备普遍性,所以具有前提条件,前提条件越多也就越难以证伪,适应性也越小,这就是为什么社科类答案不统一(噪音很大)

只要其本質是求真,就是科學,可以而且必須依據科學方法和原則來做研究分析。社科的複雜性,代表著它遠遠更爲困難,但這不是搞僞科學、文藝抒情、自由聯想、主觀論斷、或耍嘴皮子擡杠的藉口,反而在要求從業者和參與者有更高的理性、邏輯修養。如果無法滿足這樣的高標準,最起碼應該閉嘴,不要污染公共論壇。英美體制的基本謬誤之一,就在於至少在明面上,鼓勵全民參與政治社會議題的決策,那麽民粹自然無法避免(這不是說要壓制民意;事實上百姓是反映政策缺失的明鏡,但民意偏好必須只供理性決策的參考,而不能直接作爲壓倒一切其他考慮的藉口)。中國的問題則在於社科界既沒有正確的選拔標準,也沒有優良的文化傳統,更沒有明智的管理制度;還好在中國體制下,決策集團的水準原本就高於學術界,所以危害較爲有限。
2021-12-15 07:09 回复
Taizi Huang
2025-03-10 19:57
受上次”有损压缩“的讨论启发,我想从信息论的视角讨论自然科学的内涵。

信息论的一个结论是:输入信号无损压缩后的大小不能低于熵值。这是不考虑数据特征,仅依赖概率论推导而来。如果考虑了特征,该大小可以进一步降低,比如运用压缩感知技术(近似无损);特别情况下,由算法生成的数据,其信息压缩效率可以非常高(kolmogorov 复杂度)。

现代自然科学体系本身是由一个个信息压缩机器构成的系统。以基础科研为例,研究人员在主观选定研究主题和探索方向后,日常工作就是研究如何更精简地表征研究数据(无损压缩)。研究过程会经历反复试错,最后的结晶就是逻辑框架(一将功成万骨枯)。话句话说,逻辑框架是输入数据在特定视角下的无损压缩算法(实际是近似无损),是主观视角和客观逻辑矛盾结合的产物。数学的逻辑框架是公理体系,由定义、公理和定理组成;物理的逻辑框架是定律和方程,定律由实验总结而来,方程依赖严格的数学推导。

主观视角是必要条件。只有这样,才能突破被熵锁死的容量下限。回顾历史,近代数学和物理学上的革命,都来源于观念上的进步,用更高的观点、更精简的语言来解释更广泛的现象。但要注意,对现象的解释只是理解现象的一种视角,即使这种视角非常强大,却不等同于现象本身。与其说“大道至简”,不如说人只能理解简单的道,太复杂的问题就难以说出因果,只能摸着石头过河。人力有时而穷,科学的进步是一代代人薪火相传得来的。

客观逻辑也是必要条件。即便一个人对孤立事件的直觉很对,成功率达到九成,那么他连续拍四次脑袋做成一件事的概率,就迅速衰减到六成,信息率接近零。所以对复杂问题直接丢出结论是无意义的。结构化的逻辑推理构成逻辑框架。只有借助逻辑框架,从现象到结论过程中的信息损耗才能尽力降到最低,才能保证预测的品质。逻辑框架还能简化问题,便于看清主线、忽略旁支、消除噪音。实际研究中,往现有框架上再叠加一层,就是很好的进展;如果能直接精简框架,那就是大突破。物理学自伽利略开始几百年来叠床架屋,却又踏实稳固、历久弥新,正是因为体系一直在革新,维持逻辑框架的品质。

除了压缩,信息论的另一个主题是信道。语言其实就是人类文明的信道。科学语言是其中特别的一支——低容量、高带宽;伪科学可以当成信道中的噪声,噪声太高会干扰信号传输速率(浪费资源在纠错上),甚至误导结果。我感觉,古代中国没有发明精准传递思想的第二语言(比如数学语言),影响了中华文明的发展高度。从历史案例中悟道太吃天赋了,哲学思辨也不利于实操,导致古人的智慧、经验和教训难以随时空稳定传递给后人。

很高興有讀者能對科研抽象化(亦即我以前説的“提升一個Metalevel”)、並做出這麽深刻而精確的觀察和總結,我完全同意你的結論。剛好前兩天我想到自己從40多歲開始公開評論時事,到今年已經要60了,卻依舊看不到有年輕一代能繼承理性原則、分析足夠深入的潛在接棒人,心裏頗有些失望擔憂;這個留言是非常及時的解憂回復。你可以與博客所説的“法治最終還是人治”做參照;這是因爲一旦提升一個Metalevel來考慮科研者這個群體,自然就引進主觀因素。但科學研究的是宇宙現實,所以維持客觀邏輯嚴謹和觀察正確既特別方便、也特別重要。

昨天我看到Sabine的新視頻《Atomic Anomaly Confirmed! Evidence for a “dark force”?》,有些感慨:物理學竟然已經墮落到與你所述的抽象理想背道而馳的地步。這裏她討論一個MIT團隊在2020年所發表的研究結果,今年又增進了測量精度,開始宣稱“違反標準模型達23個σ”;偏偏她只是照本宣科復述了那篇論文的Abstract提要,連到底什麽東西去違反了標準模型都語焉不詳,讓我非常失望。還好我是極少數有能力去理解原始論文的人之一,所以花時間搜索並閲讀之後,原來他們鑽研的是所謂的King Plot of Isotope Shifts,也就是找幾個同位素,然後測量特定的電子能階,畫出其與原子核質量的關係;這在理論上應該是綫性的,但他們發現了非綫性關係,偏離平均綫達到23個σ。以上沒有什麽毛病,問題出在“違反標準模型”那句話;這是因爲算出應該是綫性關係的理論有好幾層,標準模型只是最底層的基礎,上面還有一大堆包含著各式各樣簡化假設的其他理論,例如同位素原子核大小和形狀可能隨中子數目增加而有非綫性變化就被忽略無視了。用一般人也可以理解的比喻來説,就像是三更半夜窗簾忽然明亮起來,測量有光照達到23個σ的確定性,然後MIT這群人就驚呼“23個σ保證太陽在半夜升起”,無視人爲探照燈照射窗戶的可能性。這裏的根本問題在於科研界的獎勵機制,是“太陽在半夜升起”論文才有期刊願意登,說探照燈根本沒人理你;而網紅如Sabine的邏輯,也同樣是“太陽在半夜升起”才足夠吸睛,而能拒絕金錢誘惑、堅持當義工推廣真相的,又有多少人呢?

回到前面所提的,一切學術題材都有人治主觀因素,包括科研在内。很不幸的,自由市場在初期提升效率之外,還有導致壟斷、金融化、和浮誇/粗鄙化("Race to the bottom" effect;這是經濟學效應,有興趣的讀者可以搜索Wikipedia)的强烈副作用,金融化更會加速後者。這裏的根本癥結,在於高能理論物理學徹底脫離實驗檢驗的範疇,不再如工程項目那樣可以簡單由成果倒推好壞;這其實是基礎科研的通病,也是爲什麽我反復强調管理基礎科研和管理產業研發,適用的原則剛好相反。你這次所提的,理想中科研進步的抽象描述,偏向基礎理論,所以必須特別小心被人性和管理機制所扭曲。
2025-03-21 00:42 修改
Taizi Huang
2025-03-20 18:02
谢谢先生您的肯定,这将激励我持续学习、思考。我所写的虽然没有新东西,但是是个不错的数学训练——将目标对象同构(近似)到一个已知的抽象结构中,借助抽象结构的结论来分析实际问题。能找到合适的问题训练一遍,心情还是很激动的。

我同时也意识到,对自然科学的 Meta 论述是自然科学知识集合的子集,所以认识不论多么深刻,一定是局限的、不完备的,应用时必须考虑适用范围,生搬硬套既有结论只是贻笑大方。不过一旦找到了合适的视角,结论就如泉涌。比如 Kelly 公式告诉我们最理性的下注比例应该是真实风险比例,所以很自然,管理极低成功概率的基础科研,就不能孤注一掷,不然“赌”不了几局,本就输光了;而人为扭曲赔率,目的正是希望对手接盘,自己反向操作套利。

博客对我在思考社科问题上也有启发。人对社会的改造越深化(当前是信息化),人性就越是影响社会演进的方向。自上而下,政治家的主观偏好影响全球格局;自下而上,群体团结可以激发伟力,而 Herd Mentality 则自我伤害。社会存在大大小小的内生周期性波动,人性很可能是其中主要的影响因素,而且越来越占主导地位。验证这个猜想,需要积累阅历。

你已經開始舉一反三了,很好。而且比起我來,你更喜歡把論證抽象化、組織化、哲學化(難怪你會志願管理博客的鏡像網站),這可能有一點年輕的因素,畢竟我的人生經歷和觀察纍積要豐富得多,列舉事實案例更方便、更習慣,但我也一直有意避免過度堆砌邏輯層級或過早做出總結歸納,這來自早年做物理學和經濟學專業的經驗教訓,那兩個原本偉大的學科都因爲沒有嚴守邏輯、緊貼事實而被自身和外來利益考量徹底扭曲了。所以我做邏輯推演,始終緊緊依附已知可靠的認知架構,而且不斷用新觀察來檢驗既有結論(因而,博客的座右銘是“事實與邏輯”,事實排在邏輯前面;邏輯是思維核心,但若與事實衝突,後者有優先權)。將來你應該會把博客的思維和你自己的融合整理出來,建立更高的邏輯架構;這不但遠比博客的千萬字規模更簡潔,也有益於觸類旁通,但附帶了脫離現實的危險,必須時時自我警惕。
2025-03-21 03:48 修改
乌鹊南飞
2025-04-21 03:00
我之前建议的由读者整理完整预测胜率表就是考虑到自我夸奖容易让人产生逆反心理的弊端,说服力和宣传教化效果更强。不知道为什么王先生觉得是要搞个人崇拜。

我理解自誇引發庸人反感(理性思維只在乎是否真實,如果敘述正確,那麽只是描述事實,自然沒有反感的必要)的心理效應,但整理預測勝率必須對預測的本質有精確的瞭解,我不認爲可以假手他人,而我自己又不想花那個時間。

幾個月前我曾突發奇想,考慮建議中國官方主辦一個社科預測競賽榜,持續以實際勝率來分辨每個教授和研究員的水分,那麽理論上社科界的人員選拔將比自然科學界的唯論文之上論還要精準;但立刻想到出題本身對認知和品格的要求都極高,我所知的大陸無人能做到。例如題目必須專注在可約的不確定性維度,否則對錯都是隨機的,毫無意義;而分辨可約和不可約不確定性,除了我之外,你還看到誰討論過?連概念都沒有,怎麽精確執行?十年前美國學界曾自己辦了一個類似的競賽,很快無疾而終;除了題目水準糟糕之外,另一個因素是少數那些較好的題目,都是民間不知名人士勝出,讓學術人臉上無光。打臉行内既得利益的體系設計,交由官僚或學術界自理的結果,就是必然扭曲規則、大開後門造成各種隱性的作弊,所以這個主意也就被我自己的反省過濾掉了。
2025-04-22 06:59 回复
百年未有之大變局
2025-04-24 16:15
 

看了樓下社科預測競賽榜的分析,那不是是代表統治階級不管官僚或是資本家要出現非平庸的人制定政策機率都很低,我不是說完全沒有機會,只是統治階級"偶然"出現一個非平庸又兼具品質無私的人機率偏低,既然如此非平庸的頂尖聰明的人出現在非統治階級的機率是不是高於那一小群既得利益者,畢竟統治階級人口基數少又很有大概率代代世襲,因為自私的人類的數量多過無私的人類數量只能用概率來預測,那麼底層人口基數大聰明又兼具品德的人是否在底層的總數就大於上層而又無法掌握權力,而頂層菁英或許有後天家庭教育的優勢,但先天的智商容易均值回歸到普通人身上(後天軟體在強硬體不行也沒用),就算開國或是創業家偶然有出類拔萃之人,世襲個兩三代也必定均值回歸,因為誰也不知道下一代世襲權力的人不論官僚或資本家會是什麼特性的人,返回平庸才是統計的大機率事件

畢竟連學術界和科學體系裡的判官和權威也會腐化,人類的歷史必然就是輪迴的就像改朝換代一樣的結構性的惡性循環,不是有句名言:「人類從歷史學到的唯一教訓 就是人類沒有從歷史汲取任何教訓」

你這是假設行業的評判者從不同集團裏的先天分佈隨機產生,但實際上評判本身就是利益分配的決定性要素,所以必然會成爲爭奪和扭曲的焦點,特別難以維持公平合理。這裏可以參考博客以往對統一升學考試的評論:作爲保障社會垂直流動性的客觀評判標準,不能妄自以“改革”為藉口濫開後門。

不過你的結論因而被進一步加强了:和平穩定狀態下,任何人類群體的自我腐化動力都極為强烈,這不但是朝代周期率的由來,映射在市場經濟上,也引發了Picketty的《21世紀資本論》中所討論的財富集中效應。
2025-04-25 13:07 回复
AbzX5
2025-04-25 00:48
这个问题之前的博文讨论过, 我曾经也这么想过, 理论上, 金融交易(甚至赌盘)似乎可以"自动"解决选题和裁判问题, 通过金额的大小决定相关预测议题的重要程度, 通过账户盈亏判定输赢. 但很可惜, 现实世界市场不是万能的, 之前的博文写过新加坡兴隆破产的事,预测正确和市场盈利并不完全一致.

是的,回報有很大的隨機性,也就是運氣,除了興隆破產的案例之外,也可以參考馬雲的致富過程。

即便是忽略隨機性、只考慮因果效應,最能穩定產生正面回報的,也不是才能或貢獻,而是掠奪,參考白人通過殖民而主宰世界500年的歷史。要排除掠奪,就必須有强大、詳細、合理並與時俱進的公共規則,但誰來主持、設計和管理這些規則呢?理想中是兼具智慧、品德和熱忱的賢能者,但現實與理想距離甚遠,實際上是比爛的世界,中國只不過是當前最不低效腐敗的體系罷了,這還是十幾年前運氣爆棚、有習近平這樣改革者上位的結果。

我所構想的社科預測競賽榜其實也有成功的可能,只不過需要足夠的資源和聚焦,把規模和熱度提升超過臨界點,就可以藉助公衆的關注來維持公平性;然而這似乎不是我一個人呼籲所能做到的。
2025-04-25 13:29 回复
返回索引页