人工智能時代下,我們如何進行社會科學研究
日期:2024-03-18 來源:中國社會科學網
人工智能如何改變了科學研究,特別社會科學研究?在這一方面,人工智能有什么優勢和缺陷?基于人工智能對社會科學研究的深度影響,我們應該如何在新形勢下學習和使用人工智能以更好地服務于社會科學研究呢?
為社會科學研究提供強大動力和發展空間
人工智能 (Artificial Intelligence),是一種模擬人類智能的計算機系統。它可以用于分析和解釋大數據、識別模式和趨勢,并做出預測或建議。科學研究的本質就是知識生產。在前人工智能時代,知識生產模式主要有兩種:其一以個體探究、興趣導向為主,即個體知識生產,比如科學家自主研究其感興趣的話題;其二以政府或者企業干預、應用導向為特征,即組織知識生產,如國家組織一系列研究所對某一重大問題進行科研攻關。隨著人工智能時代的來臨,以信息基礎設施以及信息技術的廣泛應用為特征的知識生產模式應運而生,即智能知識生產。這種模式的出現,使得知識生產的路徑、動力機制都發生了革命性改變。
第一,由于人工智能工具的使用,科研人員在研究中的角色從“全程式”參與轉變為“環節式”或“節點式”參與。一方面,研究所需要的準備性工作和基礎性任務可以交由人工智能完成,這極大節約研究人員的時間。研究人員可以將精力更多投入創造性的科研活動中去。另一方面,利用人工智能,研究人員在科研合作中的比較優勢得以充分發揮。在一項科研項目中,不同研究人員可能負責不同的部分或環節。譬如,負責理論構建部分的研究人員可以利用人工智能輔助其跟蹤最新理論動態,挖掘學科領域進一步的研究方向;負責數據分析部分的研究人員可以利用人工智能高效處理數據并解讀結果。
第二,人工智能擴展了社會科學研究領域,尤其是定量研究的發展空間。人工智能的本質是運算力、數據量和算法模型,核心是將各種應用場景中包括文字、圖像或者聲音等符號轉為數據進行處理。基于此,研究者不僅可以利用人工智能分析顯性的數據,還可以研究原來很難量化的事物。在沒有大數據的處理能力以前,衡量兩個國家之間政治經濟關系的水平是困難的。現在人工智能可以通過分析兩國間政治、經濟和文化等海量的新聞事件數據來幫助研究者達成這一目的。
第三,人工智能為社會科學研究的知識生產提供了強大的動力。社會科學研究的選題集中于解決人類社會面臨最緊迫、最重大的問題。人工智能幫助研究者更全面地了解、分析當下時事的動態發展,培養研究者對社會焦點的敏感性。此外,大數據技術是智能知識生產的技術驅動力。大數據的特點表現為“4V”,即規模性(volume)、多樣性(persity)、高速性(velocity)和價值(value)。利用高性能計算機和機器學習等技術手段對大數據進行分析、處理,為開展科學研究提供技術基礎。
人工智能在社會科學研究中的優勢與不足
使用人工智能技術的優勢體現在以下幾個方面:一是,人工智能便利了量化社會科學研究的各個環節。1.數據收集。人工智能可以根據研究者的需求確定合適的數據庫,并收集原始數據。2.數據分析。人工智能可以用于對大規模數據的描述性統計分析,并且根據數據分布特征幫助我們確定合適的統計模型。3.數據解釋。人工智能可以解釋復雜數據,識別傳統統計無法顯示的關系。這可以幫助研究者形成新的假設和見解。4.數據可視化。人工智能可以通過繪制圖表等方式將數據可視化,以便研究者理解數據并與其他研究同行分享。5.文獻綜述。人工智能可以幫助研究者確定與研究主題相關的文獻,梳理學術脈絡。當我們確定相關文獻并著手閱讀時,還可以利用人工智能軟件幫助我們理解相關文獻,指出文獻主要的貢獻與缺陷,為進一步研究指明方向。6.數據處理自動化。人工智能可以自動實現許多乏味和耗時的研究任務,如數據清洗和預處理。7.行文規范。人工智能可以按照學術化的語言風格潤色文章,生成特定期刊所要求的引文格式。
二是,人工智能可以改進傳統定量研究方法。社會科學中的定量研究主要關注可以用數據形式呈現的變量之間的變化,進而找出特定社會現象背后的規律。因果推斷的定義如下:利用社會現象或過程在時空上呈現的局部數據,基于適當的模型方法,控制數據之外的未知信息,為社會決策和研究提供信息和依據。量化研究中的過擬合(over fitting)問題使得對特定現象因果關系的揭示難以外推。已經有學者提出利用監督學習(supervised learning)框架下的正則化(regularization)和調參等方式,緩解過擬合問題。此外,對實驗研究的模擬也是保證因果推斷質量的關鍵。在匹配方法上,為了模擬更接近于隨機分配的實驗研究,有學者借助機器學習的方法來估計傾向分。
三是,人工智能技術可以幫助開發新的方法并應用于社會科學研究。基于人工智能的方法推動社會科學研究從解釋性研究向預測性研究拓展。運用機器學習技術能夠在預測精度上達到更好的效果。機器學習強調關聯性、共現性和相似性,將其運用到社會分析有顯著優勢。其一,機器學習能夠從已知信息中抽取特征向量并實現模式識別,然后利用樣本外數據進行模式驗證和預測。其二,機器學習能夠捕捉多重數據特征的關聯變化。其三,機器學習可以根據輸入數據特征自動識別特征向量、調整預測結果。這提升了預測模型在不同社會情境的適用性。
但是,人工智能在科學研究中也存在很多問題和不足,其無法取代人類在科學研究中的作用。第一,人工智能的創新能力有限。基于純粹技術工具的創新與基于(人類)情感和“頓悟”的創新存在本質不同。縱觀人類科學發展歷史,人類的靈感或者聯想在許多發明創造上發揮了重要作用。基于邏輯規則與數據處理的人工智能無法進行類似的基于心理因素與社會因素的創新。同時,創新的本質是對未知領域的探索。然而,人工智能只能處理已知的數據。對于未知問題,人工智能可能會給出不準確的結果。知識創新還有賴于對既有知識的批判式反思,在這一方面人工智能無法代替人的思維。
第二,人工智能在處理“隱性知識”(tacit knowledge)方面存在缺陷。所謂“隱性知識”是相對于“顯性知識”(explicit knowledge)而言的。顯性知識指能夠用“價值中立(value-free)的完美語言(perfect language)”,譬如數學、圖表等表達出來的知識;隱性知識則是只存在于主體意識之中,受個體經驗形塑的且無法言傳的知識。人工智能可以處理顯性知識,但是由于隱性知識的復雜性、多義性和變動性,人工智能無法對其做出有效反應。相反,人類則可以在不同情境下結合自身經驗理解隱性知識。當人工智能技術逐漸普及并達到一定瓶頸時,企業或國家之間的比較優勢來源就不再是人工智能技術,反而基于經驗與實踐的隱性知識將提供更持久的競爭力,譬如組織文化、社會網絡以及動員力。
第三,即使僅進行數據分析和處理,人工智能也存在各種問題和不足,還需要研究人員進行仔細地甄別和反復調試。比如, 1.人工智能最大的缺陷是只能處理已知的數據和問題,無法提出完全原創的探索性研究假設;2.人工智能的訓練依賴大量高質量數據。如果完全依靠計算機自動識別、抓取和編碼網絡數據,可能會產生一定的理解偏差,影響數據質量。譬如,在對復雜語句和語境的理解、對虛假信息的甄別等方面,計算機的自動處理能力較為有限;3.人工智能對參數的敏感性決定了選擇正確參數值的重要性,因此需要大量的試錯和重復訓練。4.人工智能傾向于追求模型的復雜性和預測的準確性,但是忽略了結果的可解釋性。
第四,人工智能對生產“建構意義性質的知識”作用有限。知識生產可以從描述性與建構性的意義上來理解。描述性知識生產是指創建和傳播基于描述性數據收集、分析和呈現的知識的過程。建構性知識生產是指創建和傳播基于規范、價值觀和道德原則的知識的過程。這種知識生產涉及確定什么是正確或不正確、公正或不公正的原則和標準,以及如何應用這些原則和標準來指導人們的行為和決策。人工智能的價值中立決定了其出色的描述性知識生產能力,但是也限制了其生產建構性知識的能力。此外,人工智能發揮作用取決于研究者的研究目的以及既有的學術氛圍與文化,包括同行評議等規范模式。因此,知識生產也是特定時空中社會協商的產物。人工智能顯然無法塑造獨立于研究者的學術規范。
總的來說,在人工智能的幫助下,一個從事定量研究的初級研究人員成長到高級人員所需要的技術和經驗積累都會大大加速。但是,人工智能只能對已有的數據進行處理,卻難以創造全新的知識。換句話說,人工智能不會完全取代我們對事物之間聯系的思考(科研創意)。科學研究這一復雜過程仍然需要研究人員的創造性工作。
人工智能時代應如何學習和使用研究方法
人工智能技術的發展與應用給研究帶來了重要機遇,同時也形成挑戰。我們應該充分挖掘人工智能技術在研究中的優勢,同時發揮人在研究創新的主體性作用。具體來說,我們應該做到以下幾點。
第一,加強理論和研究方法的學習,堅持對事件本質的洞察以及對事物聯系的思考。人工智能在提出原創性核心假設、闡釋數據分析結果的理論與實際意義等方面都無法超越人類。我們應該堅持數據、方法與理論相結合,不能將研究變成簡單的數據挖掘,而是要提出能夠為人類社會提供實用價值的知識成果。另外,我們要加強研究方法的深入學習,只有充分理解研究過程和每個細節,才能正確地使用人工智能。我們需要理解,解決各種不同類型的研究問題應該采用的方法。
第二,盡可能廣泛地學習人工智能技術。正如“隨機森林”的提出者布雷曼所言,“如果我們的目標是用數據解決問題,我們應該擺脫對傳統方法的過度依賴,采用多樣化的研究手段”。我們應該不斷豐富自己的研究工具箱,不僅僅要在基礎性操作上,如在數據處理、分析和可視化等環節上利用人工智能技術進行輔助,還要掌握基于人工智能的新方法,如善用機器學習等手段以得出更為精確的結果。
第三,堅持對人工智能結果的人為驗證。人工智能基于算法給出的結果有時候并不貼合實際情況。為了保證研究的質量,我們在必要的時候應該堅持人為驗證,即使這會一定程度上削弱人工智能為研究帶來的便利性。譬如,在應用大語言模型(LLM)時,我們應該保持警惕。大語言模型在回答的可靠性、質量、實時性、穩定性和安全性上均有不足。這就需要我們靜下心對相關問題進行人工考證。
(龍泰格,清華大學社會科學學院;龐琴,中山大學國際關系學院教授)