數(shù)據(jù)科學(xué)為學(xué)科發(fā)展注入全新活力
日期:2024-04-11 來源:中國社會科學(xué)網(wǎng)
政治學(xué),包括國際關(guān)系、外交學(xué)和比較政治的發(fā)展,深植于對人類政治實踐和經(jīng)驗的觀察、分析、總結(jié)和提煉。因此,現(xiàn)代政治學(xué)自脫胎之初,其發(fā)展就與廣義上的數(shù)據(jù)(經(jīng)驗證據(jù))緊密交織在一起。隨著觀察經(jīng)驗世界技術(shù)手段的不斷提升,可采集和使用的數(shù)據(jù)形態(tài)不斷豐富,以及存儲和處理相關(guān)數(shù)據(jù)的信息和計算技術(shù)升級換代,政治學(xué)所能系統(tǒng)考察的宏觀、中觀和微觀經(jīng)驗現(xiàn)象越來越豐富,討論的政治系統(tǒng)和相關(guān)衍化機(jī)制越來越復(fù)雜,所需的方法學(xué)工具和技術(shù)也變得越來越多元和精細(xì),這些都對政治學(xué)的經(jīng)驗實證研究提出了更高的要求。
數(shù)據(jù)科學(xué)是融合了計算科學(xué)、軟件工程、統(tǒng)計學(xué)和各個領(lǐng)域的專業(yè)知識而逐漸發(fā)展起來的跨領(lǐng)域?qū)W科。在過去十多年里,數(shù)據(jù)科學(xué)給整個社會科學(xué)的發(fā)展帶來了革命性的影響。除了傳統(tǒng)的計量經(jīng)濟(jì)學(xué)之外,政治學(xué)、社會學(xué)、歷史學(xué)的主流專業(yè)學(xué)會都建立了針對方法學(xué)和數(shù)據(jù)科學(xué)的專業(yè)分學(xué)會,創(chuàng)建了針對方法學(xué)和數(shù)據(jù)科學(xué)的專門學(xué)術(shù)期刊。世界一流大學(xué),包括哈佛大學(xué)、普林斯頓大學(xué)、耶魯大學(xué)、哥倫比亞大學(xué)等,均在學(xué)校層面建立了跨學(xué)科的量化或計算社會科學(xué)研究中心及平臺,開設(shè)專門的數(shù)據(jù)科學(xué)課程和認(rèn)證項目,積極培養(yǎng)數(shù)據(jù)科學(xué)人才,以期推動學(xué)科整合、提升學(xué)術(shù)研究和政策研究的實證技術(shù)和數(shù)據(jù)支撐。國內(nèi)高校近幾年也行動起來,搭建了相應(yīng)的數(shù)據(jù)科學(xué)或計算社會科學(xué)平臺。
拓展豐富研究議題
數(shù)據(jù)科學(xué)的興起為整個社會科學(xué),尤其是經(jīng)驗實證社會科學(xué)的發(fā)展注入了全新活力。數(shù)據(jù)科學(xué)與政治學(xué)的有機(jī)結(jié)合,使得之前無法深入考察的問題成為可能,許多經(jīng)典實證研究得以更加深入,同時也開啟了新的政治學(xué)研究議題。
新的數(shù)據(jù)采集和存儲方式,讓經(jīng)典政治學(xué)實證研究得以在更大尺度、更貼近真實政治實踐場景下更加細(xì)致地展開。比如,國際關(guān)系中經(jīng)典的外交互動研究,在相當(dāng)長一段時間只能依賴有限的人物傳記、回憶錄和多年之后解密的檔案資料。這不僅造成相關(guān)研究在考察的樣本量上受限,而且也在相當(dāng)程度上削弱了采集信息的即時性、有效性和可靠性。隨著新興媒體和大數(shù)據(jù)技術(shù)的普及,國際關(guān)系學(xué)者可以輕松地借助龐大且即時更新的事件數(shù)據(jù)庫——比如,綜合危機(jī)預(yù)警系統(tǒng)(icnews)和全球事件、語言和語氣數(shù)據(jù)庫(gdelt)——客觀、翔實地記錄不同國家之間外交互動的過程及內(nèi)容,進(jìn)而系統(tǒng)考察相關(guān)國際、國內(nèi)政治生態(tài)和背景對上述外交互動的影響,從而極大地豐富和拓展了研究議題。
新的數(shù)據(jù)分析模型和工具,使很多之前無法深入考察的問題成為可能。比如,國際關(guān)系研究中極為關(guān)注的信號理論,在很長一段時間內(nèi)依賴于學(xué)者們對關(guān)鍵決策人物公開言論的人工解讀和編碼。這些人工解讀和編碼在很大程度上會受到相關(guān)學(xué)者主觀判斷和立場的影響,也很容易引發(fā)一系列有關(guān)論據(jù)有效性和可靠性的爭論。隨著自然語言處理(NLP)以及新近大語言模型(LLM)等系列模型的發(fā)展和使用,基于機(jī)器學(xué)習(xí)和人工智能技術(shù)的分析工具往往能相對客觀且高效地識別特定文本的主題、表達(dá)策略和情感內(nèi)涵。再配合大規(guī)模的文檔數(shù)字化項目(主要針對歷史檔案和新聞記錄)及對社交媒體信息的及時爬取,學(xué)者們能在更大規(guī)模、更大空間、更豐富的環(huán)境和更復(fù)雜的決策背景下考察國際關(guān)系中的信號傳遞、識別、解讀、反饋等一系列理論議題。
信息技術(shù)、數(shù)據(jù)和算法不僅在方法學(xué)層面深刻影響政治學(xué)的發(fā)展,也因其對整個人類生活方式(包括政治生活方式)的巨大影響,為政治學(xué)提供了新的理論議題。比如,社交平臺通過數(shù)據(jù)采集和特定算法的結(jié)合,針對個體偏好特定投遞相關(guān)信息。這種實踐在相當(dāng)程度上強(qiáng)化了國際政治傳播和外交心理研究中本就重要的“信息繭房”效應(yīng)。傳統(tǒng)有關(guān)“信息繭房”的研究,更多是從個體認(rèn)知偏好的角度考察其中的自我選擇機(jī)制及其影響。隨著信息技術(shù)、數(shù)據(jù)和算法對國際政治傳播的全面滲透,傳統(tǒng)的理論模型已經(jīng)無法有效解釋相關(guān)的衍生和動力機(jī)制。相關(guān)理論焦點需要超越傳統(tǒng)對個人認(rèn)知和行為的強(qiáng)調(diào),逐步轉(zhuǎn)移到信息技術(shù)、數(shù)據(jù)和算法背后權(quán)力的分配、沖突和動態(tài)調(diào)整,從而更有效地理解新信息技術(shù)時代的“信息繭房”效應(yīng)及國際政治傳播的核心動力機(jī)制。
助力跨學(xué)科交流與合作
跨學(xué)科的交流與合作是推動學(xué)術(shù)進(jìn)步的關(guān)鍵,政治學(xué)的發(fā)展也是如此。除常規(guī)地從其他學(xué)科借鑒和學(xué)習(xí)相關(guān)理論模型與框架之外,對政治學(xué)而言,另一個跨學(xué)科交流和合作的關(guān)鍵點就是方法學(xué)工具與技術(shù)。隨著人類觀察經(jīng)驗世界技術(shù)手段的不斷提升,政治學(xué)者們能考察的數(shù)據(jù)形態(tài)已經(jīng)大大超越了傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)(比如統(tǒng)計年鑒的信息、世界組織提供的統(tǒng)計數(shù)據(jù)、抽樣調(diào)查采集的數(shù)據(jù)等)。大量半結(jié)構(gòu)化甚至非結(jié)構(gòu)化形態(tài)的數(shù)據(jù)可以更便捷地獲取。這些非傳統(tǒng)數(shù)據(jù)中往往隱藏了重要的政治信息,可被用于考察豐富的政治現(xiàn)象。要有效地使用這些非傳統(tǒng)數(shù)據(jù),往往需要借助計算科學(xué)、信息技術(shù)、語言學(xué)、圖像學(xué)、生物遺傳學(xué)等其他學(xué)科的專業(yè)力量,這恰恰是現(xiàn)代數(shù)據(jù)科學(xué)擅長的地方。
傳統(tǒng)政治學(xué)實證研究的量化分析主要依賴于統(tǒng)計學(xué)的工具和技術(shù),與之不同的是,數(shù)據(jù)科學(xué)一經(jīng)問世就帶著跨學(xué)科的印記。在高校數(shù)據(jù)科學(xué)研究中心工作的學(xué)者們,往往來自不同的學(xué)科,關(guān)注不同的議題。但他們有一個共同的興趣,就是力圖通過嚴(yán)謹(jǐn)、系統(tǒng)地分析不同來源、尺度的數(shù)據(jù),驗證和發(fā)展相關(guān)理論模型。這也注定了數(shù)據(jù)科學(xué)研究中心是一個跨學(xué)科的交流和合作平臺。在這些數(shù)據(jù)科學(xué)研究中心,政治學(xué)學(xué)者往往更多地在研究議題設(shè)定、理論框架搭建、實證假說推演、核心概念界定等工作環(huán)節(jié)扮演核心角色。一旦涉及概念的操作化、測量、數(shù)據(jù)采集、模型設(shè)定和數(shù)據(jù)分析等環(huán)節(jié),信息技術(shù)學(xué)學(xué)者擅長的編程和數(shù)據(jù)存儲、語言和圖像分析學(xué)者專精的模式識別、統(tǒng)計學(xué)者熟諳的算法設(shè)計和模型估算等,都將成為不可或缺的關(guān)鍵技術(shù)支撐。
比如,國際政治學(xué)學(xué)者在考察國際組織互動網(wǎng)絡(luò)的形態(tài)和演變?nèi)绾斡绊憞H制度的傳播和擴(kuò)散時,可以相對容易地借助經(jīng)典的網(wǎng)絡(luò)分析模型推演不同的制度傳播場景,并有針對性地推演可能的實證假說。但要在經(jīng)驗上識別國際組織互動網(wǎng)絡(luò)不同的形態(tài)及演化規(guī)律,就需要借助海量的數(shù)據(jù),實時記錄不同國際組織在不同網(wǎng)絡(luò)形態(tài)下的互動行為。這就需要計算機(jī)領(lǐng)域的學(xué)者編寫專門的程序抓取相關(guān)信息,并對數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。同時,還需要統(tǒng)計學(xué)學(xué)者提供有效的算法進(jìn)行必要的計算和估值,從而實現(xiàn)對相關(guān)理論假說的有效檢驗。類似的,國際關(guān)系史學(xué)者如果打算系統(tǒng)地研究海量的文本信息(歷史文件或政府檔案),那么語言學(xué)研究者就能提供相應(yīng)的技術(shù)支持,協(xié)助他們更有效地識別相關(guān)文本主題,以及不同文本之間的關(guān)系;如果外交學(xué)學(xué)者需要使用海量且更為客觀的音頻或視頻數(shù)據(jù)(電視新聞或政治領(lǐng)導(dǎo)人的現(xiàn)場演講)考察不同國家之間的外交溝通策略,那么專注于音頻或視頻分析的研究者就能提供有效的技術(shù)支持幫助其識別隱藏在不同聲音背后的情緒,以及政治領(lǐng)導(dǎo)人不同形體姿態(tài)背后的心理等。
(作者系中國人民大學(xué)國際關(guān)系學(xué)院數(shù)據(jù)科學(xué)研究中心主任、葉澄海講席教授)