中國科學院院士何積豐:應對大模型的安全問題,需設好“緊箍咒”
(相關資料圖)
極目新聞記者 周丹
模型的通用能力讓其能夠應用到人類生產生活的各個場景中,可謂“無孔不入”。AI的發展因此帶來了新的安全隱私問題,如何解決這一隱患,9月7日開幕的2023外灘大會上,中國科學院院士何積豐開出了他的“藥方”:利用對齊技術為大模型戴上緊箍咒。
何積豐院士認為,大模型的安全問題主要是在未經同意的情況下,收集、使用和泄露個人信息。隱私問題既可能發生在訓練過程中,也可能發生在使用過程中,而大模型的生成能力則讓“隱私泄露”的方式變得多樣化,造成隱私保護更加困難。
大會現場
“為了應對這些問題,我們需要大模型對齊技術。”何積豐說,“對齊(alignment)”是指系統的目標和人類價值觀一致,使其符合設計者的利益和預期,不會產生意外的有害后果?!叭绻讶斯ぶ悄芸醋魑饔斡浝锏膶O悟空,‘對齊’就是唐僧的緊箍咒。有了緊箍咒,就可以保證技術不會任意使用能力胡作非為。”
不過,對齊技術同樣面臨挑戰。首先,對齊的基礎,人類的價值觀是多元且動態變化的,需要保證大模型為人服務、與人為善;其次,大模型的有用性與無害性之間目標也不完全一致。如何對錯誤進行有效糾正,設好大模型的“緊箍咒”也是挑戰。
因此,對齊技術已成為了一項令人眼花繚亂的跨學科研究,不僅考驗技術,也審視文化。
何積豐院士介紹,反饋強化學習是實現對齊的技術途徑,目前有兩種方式,一種方式是通過人工反饋給模型不同的獎勵信號,引導模型的高質量輸出;另一種方式,事先給大模型提供明確的原則,系統自動訓練模型對所有生成的輸出結果提供初始排序?!斑@意味著,不僅智能系統需要向人類價值觀對齊,人類的訓練方法也要向價值觀對齊?!?/p>
關鍵詞:
相關閱讀
-
中國科學院院士何積豐:應對大模型的安...
中國科學院院士何積豐:應對大模型的安全問題,需設好“緊箍咒”---... -
極目銳評|中鐵五局深夜回應“高速大橋偷...
極目銳評|中鐵五局深夜回應“高速大橋偷工減料”,自己查自己如何讓... -
連藥帶鋁箔殼一股腦吞下肚,爹爹胸口胃...
連藥帶鋁箔殼一股腦吞下肚,爹爹胸口胃部疼痛被緊急送醫,醫生內鏡下不 -
親情會見照亮戒毒人員回家路
親情會見照亮戒毒人員回家路---“謝謝,謝謝你們!感謝民警提供我和小 -
每場2000個,光谷公安發放張學友演唱會...
每場2000個,光谷公安發放張學友演唱會停車碼---湖北日報訊9月8日至9月 -
生態黑番鴨,敲開致富門
生態黑番鴨,敲開致富門---極目新聞記者王佳文通訊員葛進東9月4日,在
- 中國科學院院士何積豐:應對大模型的安全問2023-09-07
- 極目銳評|中鐵五局深夜回應“高速大橋偷工2023-09-07
- 連藥帶鋁箔殼一股腦吞下肚,爹爹胸口胃部疼2023-09-07
- 親情會見照亮戒毒人員回家路2023-09-07
- 每場2000個,光谷公安發放張學友演唱會停車2023-09-07
- 生態黑番鴨,敲開致富門2023-09-07
- 安徽反腐動態:汪中新、王波、李玉林被查!2023-09-07
- 審核前公示!涉及安徽這3個縣(區)2023-09-07
- 安徽一地最新人事!任命多名干部2023-09-07
- 不作為?慢作為?阜陽出手了!2023-09-07
- 方案印發!安徽加強財會監督2023-09-07
- 安徽省民政廳:爭取將老年助浴服務納入暖民2023-09-07
- @安徽人 是否應接種流感疫苗?中疾控建議→2023-09-07
- 峽江縣:秀美田園 生機盎然(圖)空中看江2023-09-07
- 坐擁152公里長江黃金岸線 九江如何向江圖2023-09-07
- 上浮20%!贛州三孩家庭住房公積金政策有調2023-09-07
- [衡陽]耒陽:200余校同上“安全第一課”2023-09-07
- 贛州與深圳住房公積金異地繳存互認互貸2023-09-07
- 事關江西“1269”行動計劃,重點任務和責任2023-09-07
- 江西推進跨部門綜合監管“進一次門、查多項2023-09-07
- 名單發布!江西省公安廳公告:529人入闈體2023-09-07
- [衡陽]欄垅鄉中心小學退休教師提前過教師節2023-09-07
- [常德]安鄉:3名小學生分獲機器人大賽一、2023-09-07
- [郴州]宜章舉行七年級均衡分班班主任抽簽儀2023-09-07
- “長白山人參”品牌榮獲 中華品牌商標博覽2023-09-07
- 湖南涉外經濟學院組織開展安防系列技能培訓2023-09-07
- 長春市綠園區婦聯開展巾幗電商培訓2023-09-07
- 吉林市高中生喜獲全國青少年無人機大賽大獎2023-09-07
- 全國第三批城市一刻鐘便民生活圈試點名單公2023-09-07
- 夏智倫赴安全、交通、中醫藥、城建等4所高2023-09-07