大模型時代計算國際傳播研究的進展與前瞻
- 來源:對外傳播 smarty:if $article.tag?>
- 關(guān)鍵字:國際傳播,計算傳播,智能傳播 smarty:/if?>
- 發(fā)布時間:2025-05-03 10:58
周葆華 方揚
【內(nèi)容提要】大模型作為人工智能領(lǐng)域的重要突破,正在改變國際傳播研究的格局。本文基于大模型時代計算國際傳播的英文文獻,勾勒這一領(lǐng)域的基本圖景。研究發(fā)現(xiàn),大模型的計算國際傳播研究呈現(xiàn)較強的跨學(xué)科特征,文化和政治是其兩大主題,中國和美國是兩大考察地區(qū),GPT系列是主要分析模型。根據(jù)模型角色(對象/方法)和觀察視角(比較/流動),本文將大模型的計算國際傳播研究概括為“對象-比較”“對象-流動”“方法-比較”“方法-流動”四種模式,并詳細(xì)分析了其具體形態(tài)和方法操作,進而對大模型時代國際傳播研究的發(fā)展提出建議。
【關(guān)鍵詞】大語言模型 國際傳播 計算傳播 智能傳播
作為人工智能技術(shù)最引人矚目的新進展,大語言模型(large language models)的發(fā)展非常迅速,不但深刻影響社會生活,也為社會科學(xué)研究帶來重要機遇。它對國際傳播領(lǐng)域也產(chǎn)生重要影響,不但可以應(yīng)用于國際傳播的實踐,①也可以助力計算國際傳播研究(computational international communication research)。本文基于國際英文文獻,對大模型應(yīng)用于計算國際傳播研究的現(xiàn)狀進行梳理。
本文對“國際傳播”的含義采取相對廣義的理解,包括國家比較層面的傳播分析(comparative studies)和跨國之間的傳播互動(international and intercultural studies)。②在比較層面,研究聚焦于傳播現(xiàn)象在不同國家或文化背景下的表現(xiàn)差異;在傳播互動層面,研究關(guān)注信息、文化在國家或區(qū)域之間的流動與影響。大模型時代的計算國際傳播研究被定義為與大模型有關(guān)(包括作為對象與方法)、采用計算(包括文本挖掘、在線實驗、行為挖掘等)或智能方法(基于大模型)展開的國際傳播研究。我們基于“國際傳播”和“大模型”兩個核心概念構(gòu)建檢索詞組合,對社會科學(xué)引文索引(SSCI)和藝術(shù)與人文引文索引(A&HCI)數(shù)據(jù)庫的傳播學(xué)及相關(guān)學(xué)科進行系統(tǒng)檢索(時間范圍為2022年1月1日至2025年1月15日)。考慮到學(xué)術(shù)期刊的發(fā)表周期問題,我們在預(yù)印本平臺arXiv的“計算機科學(xué)”(Computer Science)分類下采用相同的檢索詞策略進行補充檢索。③經(jīng)過對文獻題目、摘要及部分正文內(nèi)容的人工閱讀,最終確定符合大模型計算國際傳播研究主題的文獻數(shù)量為54篇。接下來從研究概況、模式與方法等維度勾勒大模型時代計算國際傳播研究的發(fā)展圖景。
一、研究概況
(一)數(shù)量、平臺與主題
盡管ChatGPT在2022年問世,但當(dāng)年并未出現(xiàn)與大模型相關(guān)的計算國際傳播研究。2023年,對這一領(lǐng)域的關(guān)注逐漸開始,共有10篇文章;2024年有38篇文章;2025年初,已有6篇新成果面世。從發(fā)表平臺看,該領(lǐng)域成果呈現(xiàn)跨學(xué)科特征。其中刊載較多的期刊為《自然》(Nature)雜志下屬的《人文與社會科學(xué)通訊》(Humanities and Social Sciences Communications)(3篇),收錄最多的會議為自然語言處理實證方法會議(EMNLP,3篇)、北美計算語言學(xué)協(xié)會會議(NAACL,2篇)、語言模型會議(COLM,2篇)等,均為自然語言處理相關(guān)的國際會議。相對而言,傳播期刊的發(fā)表較少(3篇)。
從研究主題看, 與大模型相關(guān)的計算國際傳播研究主要涉及政治、經(jīng)濟、文化、軍事、環(huán)保、科技、教育等主題。其中,文化類主題最多(35篇,64.8%,可多選),關(guān)注大模型在不同國家文化、宗教、方言及飲食等方面的偏見、適應(yīng)性與文化意識。政治類主題次之(14篇,25.9 %),涉及大模型的政治偏見、對跨國政治文本的分析能力等。
?。ǘ﹪?地區(qū)與模型分布
從研究涉及的國家/地區(qū)的數(shù)量而言,有42篇文章說明了國家/地區(qū)的具體范圍;有5篇文章以不同語言(如中英文背景下的飲食文化)、宗教(如穆斯林和印度教徒的方言差異)、文化(如東西方思維)等作為比較或流動的邊界;有7篇沒有說明研究國家/地區(qū)的具體范圍。從研究的具體國家/地區(qū)來看,在指明國家/地區(qū)的研究中,美國(31篇,73.8%)和中國(23篇,54.8%)是占比最多的兩個國家,其次是德國(20篇,47.6%)、英國(19篇,45.2%)、法國、澳大利亞、西班牙、日本、印度和巴西(各有16篇,38.1%)等。
大模型的選取也存在偏向。在涉及的27個模型中:對GPT的研究最多(46篇,85.2%),其次是Llama(11篇,20.4%)、Claude 和 Gemini(各7篇,13.0%)。從大模型開發(fā)公司的所在地而言,美國模型(52篇,96.3%)占比最高,其次是中國(Qwen、GLM、INTERN-VL、Wenxin Yige/文心一格、Ernie/文心一言、Baichuan/百川,8篇,14.8%),再次是法國模型(Mixtral、Mistral,5篇,9.3%)。
二、研究模式
(一)劃分模式的兩個維度:大模型角色與國際傳播視角
首先,大模型在國際傳播研究中存在兩種主要角色:作為分析對象和作為分析方法。前者指將與大模型相關(guān)的國際傳播現(xiàn)象作為研究問題(可被視為“智能的社會科學(xué)/Social Science of AI”的組成部分),后者則指將大模型作為國際傳播問題的研究方法(可被視為“社會科學(xué)智能/AI for Social Science”的組成部分)。
其次,國際傳播研究有兩種主要視角:多國比較研究和跨國流動研究。前者主要是將不同國家/地區(qū)作為比較研究的對象、考察國家/地區(qū)在傳播現(xiàn)象上的異同,后者則考察國家/地區(qū)之間的信息、文化等的流動關(guān)系與影響(如:相互報道、信息流通、文化流動、國際輿論、全球情緒、文化適應(yīng)等)。
根據(jù)上述兩個維度的組合,我們將大模型時代的計算國際傳播研究劃分為四種主要研究模式,并統(tǒng)計了各自所占的比例:(1)對象–比較研究:30篇(55.6%);(2)對象–流動研究:5篇(9.3%);(3)方法–比較研究:10篇(18.5%);(4)方法–流動研究:9篇(16.7%)。
?。ǘ┐竽P陀嬎銍H傳播研究的四種主要模式
1.對象–比較研究
這類研究主要關(guān)注大模型在不同國家/文化上的差異或偏見/偏向。所使用的核心概念/理論主要包括:偏見(含國家偏見、政治偏見、意識形態(tài)偏見、地理偏見、社會偏見、國籍偏見、性別偏見等)、文化理解(含文化維度理論、跨文化理解、文化意識、文化認(rèn)知、文化自我感知等)、情感(如情感程序理論/affect program theories)、思維(如思維地理性/geography of thought)、擦除(含地理擦除/geographical erasure、文化擦除/cultural erasure、文化簡化/cultural simplification、文化遺漏/cultural omission)等。具體的研究主要包括如下三方面:
第一,關(guān)注大模型的國家形象偏見。研究利用大模型生成關(guān)于不同國家的描述或評價,發(fā)現(xiàn)大模型復(fù)制了固有偏見,例如對西歐國家印象更好,對拉丁美洲和非洲的評價較為負(fù)面。④還有研究進一步將國家的基本特征作為解釋變量,發(fā)現(xiàn)大模型對國家形象的呈現(xiàn)受到國家網(wǎng)民數(shù)和經(jīng)濟指數(shù)的影響——顯著偏向網(wǎng)民總數(shù)較多、人類發(fā)展指數(shù)高的國家。⑤⑥
第二,關(guān)注大模型的價值觀(文化價值觀、政治價值觀等)。例如,有研究發(fā)現(xiàn)GPT在文化價值觀(以綜合價值觀調(diào)查/Integrated Values Surveys,IVS數(shù)據(jù)測量)上偏向英語和新教歐洲國家;⑦有研究關(guān)注了大模型在心理認(rèn)知文化上的表現(xiàn),發(fā)現(xiàn)GPT在情感表達(以19個跨文化情景測量)上偏向西方規(guī)范。⑧在政治價值觀方面,有研究關(guān)注了大模型在意識形態(tài)(以墮胎議題測量)上的表現(xiàn),發(fā)現(xiàn)GPT在使用瑞典語時對相關(guān)議題的回應(yīng)更偏向瑞典,使用波蘭語時則更偏向波蘭。⑨
第三,關(guān)注大模型在具體知識和任務(wù)中的偏見。例如,有研究分析ChatGPT在環(huán)境保護上回復(fù)的建議,發(fā)現(xiàn)其很大程度強化了西方科學(xué)認(rèn)知,而忽略了低收入國家和本地社區(qū)的修復(fù)經(jīng)驗。
10當(dāng)大模型使用地理文化知識生成旅游建議時,更多提到歐洲地區(qū),對非西方文化地區(qū)表現(xiàn)不佳(總體出現(xiàn)率低、推薦原因單一)。
11這種偏見還體現(xiàn)在團隊招聘、街景圖像渲染等許多任務(wù)情景中。
2.對象–流動研究
這類研究聚焦大模型在信息或文化的跨國傳播中的表現(xiàn)與影響。所使用的核心概念包括文化(含文化適應(yīng)、文化意識、跨文化關(guān)聯(lián)等)、信息(含虛假信息、錯誤信息、數(shù)字宣傳等)和認(rèn)知效果(如確認(rèn)偏差/confirmation bias、首因效應(yīng)/primacy effect等)三個方面。具體的研究可以分為兩類:
第一,考察大模型在跨文化傳播任務(wù)中的表現(xiàn)。例如,有研究分析大模型在跨文化改編中的表現(xiàn):讓GPT、ChatGLM2等完成一項中英互譯的食譜改編任務(wù)(cross-cultural recipe adaptation),發(fā)現(xiàn)大模型的文化適應(yīng)能力存在差異——GPT在中文到英文的食譜翻譯中表現(xiàn)出色,而ChatGLM2在英文到中文的翻譯中表現(xiàn)優(yōu)異。
12還有研究分析大模型能否識別不同文化中的相似概念(如美國的新娘面紗和中國的紅蓋頭),發(fā)現(xiàn)思維鏈(CoT)的提示策略可以幫助模型識別跨文化流動中的相似性,但其跨文化理解能力仍然沒有人類準(zhǔn)確。
13
第二,考察大模型生成技術(shù)在跨國傳播中可能帶來的影響。例如,一項研究分析大模型驅(qū)動的聊天機器人如何處理俄羅斯關(guān)于烏克蘭戰(zhàn)爭的虛假信息,并發(fā)現(xiàn)這些聊天機器人的準(zhǔn)確性存在波動,特別是在非英語語境下,其識別和反駁虛假信息的能力顯著下降。
14另一項研究則分析了中道(Midjourney)生成俄烏戰(zhàn)爭相關(guān)圖像時的視覺表征特點,發(fā)現(xiàn)AI生成的戰(zhàn)爭圖像往往趨于同質(zhì)化,過分強調(diào)破壞和戰(zhàn)斗場景,而忽視了更廣泛的文化和社會語境,可能會影響公眾對戰(zhàn)爭事件的認(rèn)知和理解。
15
3.方法–比較研究
這類研究關(guān)注將大模型作為方法應(yīng)用于研究時在不同國家/文化中的效果差異,包括作為文獻推薦方法(1篇,10%)、文本分類(5篇,50%)、以及調(diào)查樣本替代(4篇,40%)。其中,除了1篇涉及到大模型與人類在混合編碼中的協(xié)同角色外(使用GPT-4對政治推文做出兩次編碼,當(dāng)出現(xiàn)分歧時由人類專家裁定),
16其余均呈現(xiàn)大模型與人類之間的比較關(guān)系——即比較大模型的應(yīng)用表現(xiàn)與傳統(tǒng)研究方法。
根據(jù)應(yīng)用的具體情景,方法–比較研究主要可以分為兩類。首先,比較大模型用于文本分析的國家/地區(qū)差異。例如,有研究發(fā)現(xiàn)大模型在多模態(tài)仇恨言論編碼中的文化偏向(以與相應(yīng)文化中的人類編碼員的一致性衡量),即大模型的編碼結(jié)果更傾向于美國文化,而與印度文化的契合度較低。
17還有研究發(fā)現(xiàn)大模型在政治分類中的跨文化差異,例如,使用GPT-4根據(jù)推文消息識別政治黨派時,在美國以外的地區(qū)準(zhǔn)確率都較低。
18
其次,比較大模型在模擬調(diào)查樣本上的差異。例如,ChatGPT在模擬世界價值觀調(diào)查(WVS)中的政治和環(huán)境議題的輿論上,對西方、英語和發(fā)達國家的表現(xiàn)更好;
19類似地,當(dāng)使用GPT-3.5來模擬公眾的政治選舉行為和對政治議題的態(tài)度時,模型在英語國家的模擬效果優(yōu)于非英語國家,在兩黨制國家(如美國)的選舉模擬表現(xiàn)優(yōu)于多黨制國家(如德國)。
20這類研究揭示了大模型作為“硅樣本”(silicon sample)的模擬局限,強調(diào)了訓(xùn)練語料多樣化的必要性。
4.方法–流動研究
這類研究主要聚焦大模型作為方法在跨國或跨文化傳播研究中的應(yīng)用價值,包括文本分類(6篇,66.67%)和問卷調(diào)查(3篇,33.33%)。其中,有2篇(22.22%)體現(xiàn)了大模型與人類的協(xié)同關(guān)系,另外7篇體現(xiàn)了比較關(guān)系(77.78%)。具體內(nèi)容包括:
首先,關(guān)注大模型方法在國際傳播流動的文本分析中的應(yīng)用。例如:有研究使用ChatGPT對美國、英國對中國的經(jīng)濟新聞報道文本進行主題分類,
21有研究使用GPT和Claude對中國社交媒體上關(guān)于烏克蘭危機的討論發(fā)帖進行立場分類,
22還有研究運用GPT對優(yōu)兔上瑞典網(wǎng)民對羅姆移民議題的評論中的仇恨言論進行主題分析。
23
其次,關(guān)注大模型在跨國/跨文化調(diào)查中的問卷改編應(yīng)用。例如,有研究使用AI預(yù)測試從美國改編至南非的問卷,發(fā)現(xiàn)經(jīng)過GPT審閱和迭代后的問卷在清晰度和偏見問題上相比原始版本表現(xiàn)更好,并大大減少了傳統(tǒng)專家審閱和用戶測試的時間和成本;
24有研究則指出,GPT在翻譯問卷的質(zhì)量和問題識別方面具有潛力,但對復(fù)雜語境的理解和輸出的穩(wěn)定性不足。
25
三、研究方法
?。ㄒ唬﹨?shù)設(shè)定
我們編碼了所有54篇文獻中對相關(guān)參數(shù)的設(shè)置情況,主要包括溫度、響應(yīng)次數(shù)等。結(jié)果發(fā)現(xiàn):有37篇(68.5%)明確了每個提示的響應(yīng)次數(shù)。其中,只考慮模型單次輸出的情況最多(14篇,37.8%)、其次是3次和100次輸出(各4篇,10.8%)。
有20篇文獻(37.0%)明確了溫度的設(shè)置,共有13種不同的溫度設(shè)置(可多選)。設(shè)置為0的有10篇(50%),設(shè)置為1的有8篇(40%),設(shè)置為其他溫度的有9篇(45%)。在20篇文獻中,有6篇研究(30%)探究了大模型在不同的溫度設(shè)置下的表現(xiàn),剩余14篇(70%)研究使用了單一的溫度設(shè)置。
溫度和響應(yīng)次數(shù)影響著輸出的穩(wěn)定性,取決于任務(wù)的不同需求,每篇文章具體的設(shè)置差異較大。但研究發(fā)現(xiàn),即便是相似的主題和任務(wù),參數(shù)的設(shè)置也存在差異。例如,在研究GPT模型的國籍偏見時,研究者為了避免偶然性,讓每個提示在4種溫度設(shè)置下(0、0.3、0.6、0.9)生成2輪話語,在計算相似度后選擇是否合并,
26而另外兩篇研究國際偏見的文章則未提及溫度設(shè)置,將每個提示的響應(yīng)次數(shù)設(shè)置為100。
27
28
?。ǘ┨崾驹O(shè)計
提示(prompt)是用戶給大模型的指令,模型會根據(jù)這些指令生成相應(yīng)的輸出,不同的提示設(shè)計會顯著影響大模型的輸出結(jié)果。在社會科學(xué)研究中,微調(diào)通常因需要大量的計算資源和訓(xùn)練數(shù)據(jù)而難以實現(xiàn),因此,簡單輕量的提示設(shè)計在大模型使用的零樣本和少樣本學(xué)習(xí)場景中具有重要作用。
29
研究發(fā)現(xiàn),在提示設(shè)計中,“角色扮演”(role-play)的使用最多。主要有具有特定文化身份的角色(如作為在某國長大的人、天主教徒、聯(lián)合國維和人員等)、分析輔助型角色(如定性研究員、敘事學(xué)家等)兩種。前者主要是為了得到特定文化身份的回答,從而獲得模型對不同文化的模擬和評估。例如,讓LLaMA扮演不同宗教教徒以獲得模型對不同宗教的情感表達,評估模型的文化偏見。
30后者主要是為了幫助模型理解、生成和分析與跨文化、多語言背景相關(guān)的內(nèi)容,例如,讓ChatGPT扮演精通某國文化的專家,從而實現(xiàn)對問卷的跨文化改編。
31
四、總結(jié)與思考
本文總結(jié)了大模型時代計算國際傳播研究的發(fā)展特征。第一,呈現(xiàn)社會科學(xué)與計算機技術(shù)交叉的學(xué)科特征,文化和政治是其中的重要主題;第二,從國家來看,美國和中國是研究最多的兩個國家;從模型來看,GPT系列是研究最多的模型;第三,本文基于大模型角色(對象vs.方法)和國際傳播視角(比較vs.流動)提出大模型計算國際傳播研究的四種模式,并發(fā)現(xiàn)其作為分析對象主要集中于研究大模型的跨國和跨文化偏見,作為方法則主要應(yīng)用于文本分析和調(diào)查研究;第四,大模型的設(shè)置在響應(yīng)次數(shù)上以單次為主,主要采用“角色扮演”型的提示設(shè)計。
基于上述發(fā)現(xiàn),我們認(rèn)為,大模型時代的計算國際傳播研究可以在如下方面進一步發(fā)展:第一,傳播學(xué)應(yīng)當(dāng)更加重視大模型時代的計算國際傳播研究。目前,相對于計算機學(xué)科,傳播研究的關(guān)注相對不足,值得加強;第二,超越“西方中心主義”。目前大模型時代的計算國際傳播研究仍然存在一定程度的西方中心主義傾向——表現(xiàn)在無論是所研究的國家還是模型產(chǎn)地,仍以美國和歐洲主要國家為主。在推動全球文化互鑒與信息流通的國際傳播背景下,未來研究可以納入更多來自全球不同地區(qū)和不同發(fā)展階段的國家,以及與這些國家相關(guān)的本地化大模型,從而更加全面地反映全球多樣化的傳播格局;第三,加強解釋性研究。現(xiàn)有研究主要側(cè)重于描述大模型的具體表現(xiàn)或方法潛力,缺乏較為深入的理論探討。例如,對大模型在國際傳播中的偏見的描述性分析較多,但解釋性分析不足,這方面需要大力加強;第四,對大模型作為國際傳播的研究方法有更好的定位。盡管一些研究探討了大模型在國際傳播研究中的潛力,但都是從比較的角度展開,缺乏與人類的協(xié)同研究。實際上,由于大模型偏見和響應(yīng)的各種問題,其應(yīng)用并不總是那么有效,人工智能應(yīng)被視為協(xié)助、改進或增強研究的工具,而非完全替代傳統(tǒng)研究方法;第五,國際傳播研究中對大模型的操作設(shè)計需更規(guī)范。模型的參數(shù)設(shè)置和提示設(shè)計一方面需要適應(yīng)國際傳播研究的具體情景,另一方面也會對國際傳播的結(jié)果產(chǎn)生重要影響。然而,目前國際傳播研究中大模型的參數(shù)設(shè)置存在較大差異,既缺乏足夠充分的報告,也缺乏解釋說明,因此,大模型時代的計算國際傳播研究需要增強方法運用與操作設(shè)計的規(guī)范性、透明性、解釋性,這不僅能夠提高國際傳播研究的質(zhì)量和可靠性,也有助于推動國際傳播理論的創(chuàng)新與發(fā)展。
本文系國家社科基金人才項目(22VRC186)、上海數(shù)學(xué)與交叉學(xué)科研究院項目(SIMIS-ID-2024-LZ)的階段性成果。
周葆華系復(fù)旦大學(xué)信息與傳播研究中心研究員,
復(fù)旦大學(xué)新聞學(xué)院教授,全球傳播全媒體研究院研究員,復(fù)旦大學(xué)國家發(fā)展與智能治理綜合實驗室研究員;
方揚系復(fù)旦大學(xué)新聞學(xué)院研究生
