百度發布中國版ChatGPT
日期:2023-03-17 來源:深圳特區報
深圳特區報訊(記者 周雨萌)“幫我畫《灌籃高手》中的櫻木花道”,只見兩三秒時間,對話框便生成了櫻木花道的頭像;“幫我寫一篇百度文心一言的新聞稿”,一篇約300字左右的短訊就生成了……昨日,百度正式發布新一代大語言模型、生成式AI產品——文心一言,并開啟首批內測,本報記者率先體驗了一把與這款AI產品的對話。
文心一言是繼OpenAI發布ChatGPT后,中國第一款生成式語言大模型產品。在此次體驗過程中,文心一言都能快速捕捉關鍵詞,并準確給出想要的答案,全程的使用體會是流暢、好用。
百度創始人、董事長兼首席執行官李彥宏在會上多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大,未來這段時間它一定會飛速發展,日新月異。
現場,李彥宏也演示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。其中,文心一言可以續寫知名科幻小說《三體》,共提出五個續寫《三體》的建議角度,并準確回答了《三體》作者、電視劇角色扮演者等事實性問題。
在面對“于和偉和張魯一有哪些共同點”這類問題,文心一言基于推理能力也得出了正確答案。文心一言還順利完成了給公司起名、寫Slogan和新聞稿的創作任務。體現出其具有對話問答、總結分析和內容創作生成等綜合能力。
此外,文心一言還表現出優秀的中文理解及多模態生成能力。例如,其能正確解釋成語“洛陽紙貴”的含義、其對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。更有趣的是,文心一言能夠生成四川話等方言語音。
據介紹,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
文心一言是百度過去多年投入AI、持續努力的延續。百度首席技術官王海峰道出了其背后的技術:“文心一言是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎上研發的。其關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。其中,后三項是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。”
據了解,百度是全球為數不多,在“芯片-框架-模型-應用”四層進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能云、自動駕駛、小度等應用,各個層面都有領先的自研技術。
目前,百度是全球大廠中第一個做出對標ChatGPT產品的企業。李彥宏指出,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。
文心一言和生成式AI代表了一個新的技術范式,自今年2月百度官宣“文心一言”以來,包括深圳報業集團、金蝶等已超過650家企業單位宣布接入文心一言生態。很多企業也已經意識到,這種新的技術范式將會影響到千行百業。
會上,李彥宏預測,大語言模型將帶來三大產業機會。第一類是新型云計算公司、第二類是進行行業模型精調的公司、第三類是基于大模型底座進行應用開發的公司,即應用服務提供商。
“我們相信,人工智能會徹底改變我們今天的每一個行業。AI對各行各業的顛覆性改變才剛剛開始。未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的里程碑事件發生。”李彥宏說。