多角度思考數據科學與數字鴻溝
日期:2021-08-23 來源:中國社會科學網-中國社會科學報
數字鴻溝是指現代信息工具擁有者與未擁有者之間,在信息可及性上存在巨大差異,具體表現為信息技術帶來的益處在社會中的不平均分配。這一概念首先出現于1995年的美國,此后不久傳播到歐洲及世界其他地區。到2000年,學界就數字鴻溝的具體概念及涵蓋的相關問題基本達成共識。近年來,數字技術本身的發展及其對社會的價值和影響成為各界共同關注的重大議題,相關討論不斷深入,相關學術研究的視角和方法也日益豐富多樣。數字鴻溝一直是學界頗為關注的問題,特別是針對弱勢群體如何跨越數字鴻溝的問題,各國政府紛紛進行了政策嘗試。
數字鴻溝研究逐級深入
據荷蘭特文特大學傳播學系榮休教授簡·凡·迪克(Jan A. G. M. Van Dijk)介紹,數字鴻溝及相關研究可分為三個層面,對應三個時期。
第一個是物理訪問層面,從1995年至2003年。1995年,美國《洛杉磯時報》首次使用“數字鴻溝”一詞。隨后,美國國家電信和信息管理局發布報告《“漏網之魚”:針對美國農村和城市中信息窮人的一項調查》,描述了美國農村和主要城市中無法享受到國家信息基礎設施的人群特征,包括低收入家庭、原住民和少數族裔、受教育程度較低者。報告中多次提及“數字鴻溝”,讓這一概念在媒體和美國政界流行起來。2001年,英國政治學家皮帕·諾里斯(Pippa Norris)出版的《數字鴻溝:世界范圍內的公民參與、信息貧窮與互聯網》一書,成為首部被經常引用的關于數字鴻溝的學術著作。諾里斯主要討論了數字鴻溝的物理訪問層面,即是否擁有計算機、是否可以接入互聯網,并區分了發達國家與發展中國家之間的全球鴻溝、一國內部富人與窮人之間的社會鴻溝、是否將互聯網資源用于社群參與的民主鴻溝。
1995-2001年,美國和一些歐洲國家的計算機擁有率和互聯網接入率大幅上升,人們對新的信息通信技術總體上抱有積極樂觀態度。但在2001年前后開始出現另一種聲音。有學者提出,數字鴻溝并不存在,這一概念本身就是偽命題。不少民眾也認為,數字設備和服務與廣播、電視、電話等一樣,也會出現“涓滴效應”,最終會普及每一個人。2000-2005年,關于數字鴻溝的研究成果發表數量達到高峰。這些研究和討論由經濟學家、電信學研究人員、政策制定者或商業領導人主導,而且這些主導者幾乎都是美國人。他們持技術決定論觀點,認為新技術的傳播充滿機遇且不可避免,市場力量被啟動后,數字設備和服務將會全面普及。
第二個是技能和使用層面,從2004年起延續至今。這一時期,學者和政策制定者開始跨出物理訪問的討論范疇,社會科學家首先提出“數字鴻溝是一個復雜的動態現象”。美國紐約市立大學社會學教授保羅·阿特維爾(Paul Attewell)、瑞士蘇黎世大學互聯網使用與社會研究教授埃斯特·哈吉泰(Eszter Hargittai)等人強調了信息技術使用和數字素養的不平等。他們的核心觀點是:如果沒有必要的技能、知識、對有效使用的支持,擁有物理訪問是無用的。數字鴻溝問題首先是社會、經濟、文化和政治問題,而非技術問題。
這一時期,計算機體積越來越小、運算速度越來越快、價格越來越低,互聯網接入率和計算機購買量迅速上升。2004-2014年,互聯網使用者在世界總人口中的占比從不足15%上升至接近45%。2004年以來,社交媒體和智能手機行業蓬勃發展,極大地改善了用戶體驗。21世紀第一個十年,互聯網成為發達國家70%以上人口日常生活的一部分。不過,在發展中國家,接入并使用互聯網的人口比例遠低于發達國家。各國政府機構和教育機構逐漸意識到,只有讓互聯網新用戶獲得技能和相關應用程序,才能支持經濟、社會和文化發展。
因此,隨著互聯網的快速普及,數字鴻溝研究的焦點轉向新用戶技能,研究范圍大幅擴展,并將機會和不平等話題納入進來。2004年以來,“數字鴻溝”一詞在學術出版物中越來越少見,關鍵詞轉變為“互聯網/社交媒體使用”“數字/信息素養”“數字技能”等有關機會、不平等和應用的概念。2004—2012年,關于數字素養和互聯網使用類型學的新的概念框架和操作性定義不斷涌現,一些研究人員開始在實驗室、田野實驗和調查中測試數字技能。這個階段數字鴻溝研究的另一個焦點是用戶群體,許多學者注意到與知識鴻溝相似的“使用鴻溝”開始出現——一些人主要使用有助于其獲取信息、接受教育或增強職業競爭力的互聯網產品,另一些人則主要使用娛樂以及簡單的商業和交際用途的互聯網產品。2004年以來,大部分數字鴻溝研究聚焦于計算機和互聯網使用的差異和不平等。這些研究雖然仍以美國為主,但英國、荷蘭、西班牙、巴西、智利、墨西哥、韓國、新加坡、中國的研究更加豐富并受到關注,說明這一領域變得日益國際化。
第三個是結果層面,從2012年延續至今。隨著計算機和互聯網的普及,一些學者和政策制定者開始思考數字鴻溝對公民、機構和社會的影響。2012年,西班牙馬德里自治大學社會學系教授克里斯托巴爾·托雷斯·阿爾貝羅(Cristóbal Torres Albero)和馬德里康普頓斯大學應用社會學系講師何塞·曼努埃爾·羅布雷斯·莫拉萊斯(José Manuel Robles Morales)開展了一項互聯網訪問和使用調查并提出,未接入互聯網且不具備必要技能的人將無法受益于越來越多的無線下替代品的網絡服務。同年,簡·凡·迪克和荷蘭特文特大學傳播學教授亞歷山大·凡·德爾森(Alexander J. A. M. Van Deursen)調查并發現,數字技能缺乏和數字技術故障導致荷蘭勞動者生產率降低。同時,受教育程度較高的人、年輕人受益于互聯網的程度遠高于受教育程度較低的人、老年人。
過去5年里,互聯網及終端設備進一步普及。“數字落后者”在發達國家人口中占比為10%—33%,但在發展中國家仍高達50%-90%。研究人員和政策制定者都開始關注互聯網和數字媒體使用的結果。有人對數字鴻溝的特殊性發出疑問——畢竟在每個時代都有新的技術問世。在簡·凡·迪克看來,新興信息通信技術的訪問和使用比印刷媒體、廣播、電視、電話更重要,因為前者是通用型技術。傳統技術雖然對知識獲取、娛樂、通信起著重要作用,但互聯網和數字媒體是當代社會中每個人在扮演任何角色時都需要的。數字鴻溝影響著個體在教育、工作、市場、社群、政治和文化等領域的參與度,決定著個體是融入社會還是被排除在外。
批判性數據研究興起
進入21世紀第二個十年,數字基礎設施建設和應用加速,大數據、人工智能技術迅猛發展,物聯網快速興起。互聯網和數據對社會的作用和影響與日俱增,許多重大問題隨之產生。例如,大規模研究數據將幫助我們創造更好的工具、服務和公共物品,還是掀起隱私侵犯和侵入性市場營銷的新浪潮?數據分析學是否有助于理解網絡社群和政治運動,是否將改變我們研究人類交際和文化的方式?于是,批判性數據研究領域應運而生。
2012年,美國微軟研究院研究員達納·博伊德(Danah Boyd)和高級首席研究員凱特·克勞福德(Kate Crawford)發表文章《大數據的批判性問題》稱,大數據的崛起既是技術現象,也是社會現象,因此有必要批判性地質疑相關假設和偏見。她們將大數據視為一個以技術、分析、神話的相互作用為基礎的文化、技術和學術現象。技術指的是將計算能力和算法準確性最大化,以收集、分析、聯系和比較大型數據組;分析指的是基于大型數據組來識別模式,以提出經濟、社會、技術和法律規范;神話指的是大型數據組提供了更高級的智慧和知識形式,由此產生以往不可能獲得的見解,并帶有真理性、客觀性、準確性的光環。博伊德和克勞福德提出了六個論點,以期激發各領域關于大數據的討論:大數據改變了知識的定義;宣稱大數據絕對客觀、準確具有誤導性;大數據不總是更好的數據;如果脫離背景,大數據將失去意義;能夠獲取不意味著符合倫理;對大數據的有限訪問造就了新的數字鴻溝。
《大數據的批判性問題》激起了學術界對批判性數據研究的興趣,首次使用“批判性數據研究”這一術語的是美國霍夫斯特拉大學全球研究與地理學助理教授克雷格·M.道爾頓(Craig M. Dalton)和美國華盛頓大學塔科馬校區城市研究助理教授吉姆·撒切爾(Jim Thatcher)。他們在2014年發表的文章《批判性數據研究是什么以及我們為什么關心它?》中提出若干關鍵論點,以推動對新的數據制度的全面批判。
第一,必須將大數據置于時間和空間當中。19世紀的統計制圖、社會物理學,20世紀五六十年代的地理學計量革命、基于地理人口細分的市場營銷以及信息技術產業的盛衰循環,都為大數據時代的到來創造了條件。如今,大數據嵌入社會過程中,催生了企業、政府、公民之間的、新的權力幾何學。我們必須提問:數據是誰的?數據收集依據何種規范?目的是什么?
第二,技術永遠不像看起來那樣中立。在創造和解讀大數據的過程中,大數據技術永遠與文化環境相互決定。對大數據的工具性審視,將導致人們忽視大數據技術產生的根本性的認識論影響。我們必須提問:被量化意味著什么?大數據作為一種技術形式,對我們的文化和生活帶來什么樣的可能性和約束?
第三,大數據不能決定社會形態。技術變革與社會之間的關系錯綜復雜,大數據在社會變化中的作用遠不是數據分析或對社會建模這么簡單。技術的創新、生產、應用普及發生在充斥著權力、經濟、身份、偏見等元素的社會背景下,并反映社會背景。一種技術不可能脫離其背景單獨起作用,更不能決定社會形態。
第四,數據從來不是未加工的。對一切數據的生產和解讀,都是社會實踐的結果。每個數據模型對信息編碼和建立結構的方式,都遵循了研發人員的設想。哪些信息被量化、存儲、分類?哪些被丟棄?任何數據組都是對世界的有限表現,這樣理解數據才能使其揭示出某些有意義的規律。
第五,“大”不意味著一切。大數據分析不可能回答所有問題,因此它不能替代更加成熟的定性和定量研究方法。在定性研究中,科研人員通過直接詢問參與者的個人感受和動機,得到關于參與者立場的深度、細節化信息。在田野研究中,科研人員親身體驗一個地方、一種背景,這些都是大數據難以提供的。此外,關聯性與因果性之間的區別、數據組的價值等問題在大數據時代依然存在。將大數據與“小數據”及其他已有的研究途徑結合起來協調使用,能夠在研究話題、方法、概念、意義等方面開辟新的可能性。
2016年,美國賽吉出版公司旗下期刊《大數據與社會》出版《批判性數據研究》專刊,多國學者從哲學、治理、科研倫理、金融市場、農業、發展和援助等角度探討了數據與整個社會以及個人日常生活之間的相互作用。他們表示,批判性數據研究為人們提供了必要的工具,人們可以運用這些工具提升自身的數字素養,并為數據公正作出努力。批判性數據研究還應鼓勵人們在共同利益框架和社會背景下思考數據科學。
中國社會科學報記者 王悠然