åªè¦ç®€å•å‡ ä¸ªæç¤ºè¯ï¼Œäººå·¥æ™ºèƒ½ï¼ˆAIï¼‰å·¥å…·å°±èƒ½ä¸ºæˆ‘ä»¬ç”ŸæˆæŒ‡å®šçš„æ–‡æœ¬ã€å›¾ç‰‡ã€è§†é¢‘ï¼Œä¸€é”®è¯†åˆ«å¿«é€Ÿç»™å‡ºä½œä¸šçš„ç”æ¡ˆï¼Œç”šè‡³èƒ½æ€è€ƒå¹¶å®ŒæˆPPT的制作。é‡åˆ°é—®é¢˜å…ˆæ‰¾“AI”,æˆä¸ºè¶Šæ¥è¶Šå¤šäººçš„æ—¥å¸¸ã€‚然而,图片å¯èƒ½å¹¶ä¸ç¬¦åˆæ—¶ä»£èƒŒæ™¯ã€ç»™å‡ºçš„ç”æ¡ˆä»”细查è¯å¹¶ä¸çœŸå®žï¼Œç”šè‡³ä¼šç¼–çº‚æ³•å¾‹æ¡æ–‡æˆ–历å²äº‹ä»¶……è¿™ä¹ˆèªæ˜Žçš„AI,为什么会“一本æ£ç»åœ°èƒ¡è¯´å…«é“”呢?

AI幻觉为多领域引入风险
11月12日,法治日报报é“了北京市通州区人民法院审结的一起案件,看似“完美ä½è¯”çš„æ¡ˆä¾‹ï¼Œå´æ˜¯AI软件“æé€ ”的虚å‡ä¿¡æ¯ã€‚åœ¨ä¸€èµ·å•†äº‹çº çº·æ¡ˆä»¶ä¸ï¼ŒåŽŸå‘Šä»£ç†äººåºåŽå‘法院æäº¤äº†ä¹¦é¢æ„è§ï¼Œå…¶ä¸æ´å¼•了åä¸ºæœ€é«˜äººæ°‘æ³•é™¢çš„æŸæ¡ˆä¾‹åŠä¸Šæµ·ä¸€ä¸é™¢çš„(2022)沪01民终12345å·æ¡ˆä»¶ã€‚ä¸¤æ¡ˆçš„äº‹å®žç»†èŠ‚ã€æ³•律争议与è£åˆ¤é€»è¾‘都与审ç†ä¸çš„æ¡ˆä»¶é«˜åº¦å¥‘åˆï¼Œå®Œç¾Žä½è¯åŽŸå‘Šä»£ç†äººä¸»å¼ 的观点。
然而,“完美”ç»ä¸èµ·æŽ¨æ•²ï¼Œç»æŸ¥ï¼Œä¸¤èµ·æ¡ˆä¾‹å‡ä¸ºAI“ç¼–é€ ”,是以审ç†ä¸çš„æ¡ˆä»¶ä¸ºåŸºç¡€åå¤å‘AI大模型软件æé—®å¾—出的结果。这ä¸ä»…让我们看到AI虚å‡ä¿¡æ¯è¿›å…¥å¸æ³•程åºï¼Œç»™å¸æ³•å…¬æ£å¸¦æ¥çš„风险,也将“AI幻觉”çš„é—®é¢˜é‡æ–°æç¤ºåœ¨å¤§ä¼—é¢å‰ã€‚
事实上,AIå†…å®¹é€ å‡å¹¶éžæ–°è¿‘è¯é¢˜ã€‚早在AI软件普åŠä¹‹åˆï¼Œå°±æœ‰ç½‘å‹å‘现,AIè½¯ä»¶ä¼šç”Ÿæˆæ ¹æœ¬ä¸å˜åœ¨çš„内容,或者引用ä¸å˜åœ¨çš„æ³•å¾‹æ¡æ–‡ã€å‚考文献ç‰ï¼Œè™½ç„¶å¤§å¹…æé«˜äº†ç”Ÿäº§å’Œå·¥ä½œæ•ˆçŽ‡ï¼Œå´å¸¦æ¥äº†“ä¿¡ç”¨å±æœº”。
在今年2月由清åŽå¤§å¦æ–°é—»ä¸Žä¼ æ’å¦é™¢æ–°åª’ä½“ç ”ç©¶ä¸å¿ƒä¸Žäººå·¥æ™ºèƒ½å¦é™¢å‘布的《DeepSeek与AI幻觉》报告(以下简称报告)ä¸ï¼ŒAI幻觉被定义为“模型生æˆä¸Žäº‹å®žä¸ç¬¦ã€é€»è¾‘æ–裂或脱离上下文的内容,本质上是统计概率驱动的‘åˆç†çŒœæµ‹’。”
报告列举了一起Whisper自动è¯éŸ³è¯†åˆ«ç³»ç»Ÿåœ¨åŒ»ç–—领域的应用案例。该系统å¯ä»¥å°†æ‚£è€…与医生问诊过程的音频转写为文å—病历,已覆盖超过3万å临床医生和40个医疗系统。这本应æˆä¸ºå°†åŒ»ç”Ÿä»Žç¹é‡çš„æ–‡æ¡ˆå·¥ä½œä¸è§£æ”¾å‡ºæ¥çš„先进工具,å´å¯¼è‡´äº†ä¸¥é‡çš„åŽæžœã€‚
ç»æŸ¥ï¼Œ100å¤šä¸ªå°æ—¶çš„Whisperè½¬å½•æ ·æœ¬ä¸ï¼Œçº¦æœ‰ä¸€åŠå†…容å˜åœ¨å¹»è§‰ã€‚进一æ¥è°ƒæŸ¥å‘现,2.6万份自动转录病例ä¸ï¼Œå‡ ä¹Žæ¯æœ¬éƒ½å˜åœ¨çžŽç¼–和幻觉问题,对患者å¥åº·å’ŒåŒ»ç–—系统带æ¥äº†ä¸¥é‡çš„è´Ÿé¢å½±å“。
ç©¶å…¶åŽŸå› ï¼Œ“看起æ¥éžå¸¸èªæ˜Žï¼Œèƒ½å›žç”很多问题的大è¯è¨€æ¨¡åž‹ï¼Œæ‰€è°“çš„‘智能’其实是算出æ¥çš„。既然是计算,本身就å˜åœ¨ä¸€å®šçš„ä¸ç¡®å®šæ€§ï¼Œç»™å‡ºæ¥çš„ç”æ¡ˆä¹Ÿä¼šæœ‰å差。”陈钟解释é“。
å¤šå› ç´ äº¤ç»‡å¯¼è‡´AI幻觉
那么,影å“å¹»è§‰çŽ‡é«˜ä½Žçš„å› ç´ æœ‰å“ªäº›ï¼Ÿ
“ä¸ä»…æœ‰ç®—æ³•çš„å› ç´ ã€ç®—åŠ›çš„å› ç´ ï¼Œè¿˜æœ‰è®ç»ƒæ•°æ®å’Œè®ç»ƒè¿‡ç¨‹çš„å› ç´ ï¼Œè¿™äº›å› ç´ éƒ½ä¼šå¯¼è‡´å¤§è¯è¨€æ¨¡åž‹å‡ºçŽ°å¹»è§‰çŽ‡è¾ƒé«˜çš„æƒ…å†µã€‚”陈钟介ç»é“。
æ‰€è°“å¹»è§‰çŽ‡é«˜çš„æƒ…å½¢ï¼Œä¸€æ–¹é¢æ˜¯è®¡ç®—本身的算法有相应的å差,还有一些情况虽然算法å¯èƒ½æ˜¯å‡†ç¡®çš„,但是计算精度ä¸å¤Ÿä¹Ÿä¼šå¸¦æ¥å差。æ¤å¤–,数æ®åœ¨åšè®ç»ƒæ—¶ï¼Œäººç±»é€šå¸¸ä¼šé‡‡ç”¨å¥–励函数æ¥å¼•å¯¼è®¡ç®—è¿‡ç¨‹å’Œç”æ¡ˆä¹‹é—´çš„对应关系。一旦奖励函数出现了å差,相应地也会带æ¥å¹»è§‰ã€‚
值得关注的是,AI大模型è®ç»ƒè¿‡ç¨‹ä¸è¿˜å‡ºçŽ°äº†ä¸€ç§æ–°çš„“æ•°æ®æŠ•毒”污染,å³åœ¨è®ç»ƒAI大模型时,在数殓投喂”的过程ä¸ï¼Œæ•…æ„åŠ å…¥ä¸€äº›è™šå‡çš„内容,或者是修改其模型文件(整个è®ç»ƒçš„结果),让AI生æˆçš„ç”æ¡ˆç¬¦åˆæŸäº›ç‰¹å®šæ„图。
æ ¹æ®æ–°åŽç½‘的报é“,当è®ç»ƒæ•°æ®ä¸ä»…有0.01%çš„è™šå‡æ–‡æœ¬æ—¶ï¼Œæ¨¡åž‹è¾“å‡ºçš„æœ‰å®³å†…å®¹ä¼šå¢žåŠ 11.2%ï¼›å³ä½¿æ˜¯0.001%çš„è™šå‡æ–‡æœ¬ï¼Œå…¶æœ‰å®³è¾“出也会相应上å‡7.2%。
è¿™ç§“æ•°æ®æŠ•æ¯’”除了会导致ä¸è‰¯ä¿¡æ¯ã€è™šå‡ä¿¡æ¯å¤–ï¼Œè¿˜ä¼šé€ æˆæ›´ä¸¥é‡çš„åŽæžœã€‚比如在医疗领域,被“投毒”çš„AI大模型å¯èƒ½ä¼šè¯¯è¯Šç—…情;在金èžé¢†åŸŸï¼Œè¢«ç¯¡æ”¹çš„算法å¯èƒ½å¼•å‘äº¤æ˜“é£Žé™©ï¼›åœ¨è‡ªåŠ¨é©¾é©¶é¢†åŸŸï¼Œæ¶æ„æ•°æ®å¯èƒ½è®©è½¦è¾†åœ¨å…³é”®æ—¶åˆ»å¤±æ˜Žï¼Œç‰ç‰ã€‚
AI幻觉的分类
陈钟介ç»ï¼ŒAI幻觉åˆåˆ†ä¸ºäº‹å®žæ€§å¹»è§‰å’Œå¿ 实性幻觉。事实性幻觉指的是AI大模型生æˆçš„内容与实际å˜åœ¨äºŽçŽ°å®žä¸–ç•Œçš„äº‹å®žä¸ä¸€è‡´ã€‚我们ç»å¸¸è¯´çš„一本æ£ç»åœ°èƒ¡è¯´å…«é“å¯ä»¥ç†è§£ä¸ºäº‹å®žæ€§å¹»è§‰çš„一ç§è¡¨çŽ°ã€‚
å¿ å®žæ€§å¹»è§‰æŒ‡çš„æ˜¯AI大模型生æˆçš„内容与用户的æé—®ä¸ä¸€è‡´ï¼Œä¹Ÿå°±æ˜¯AIå·¥å…·ç»™å‡ºçš„ç”æ¡ˆå¯èƒ½æ˜¯å¯¹çš„ï¼Œä½†å¹¶ä¸æ˜¯ç”¨æˆ·æƒ³è¦çš„,简而言之就是“ç”éžæ‰€é—®”。
举例æ¥è¯´ï¼Œå¦‚果用户æé—®ï¼Œ“糖尿病患者å¯ä»¥é€šè¿‡åƒèœ‚蜜æ¥ä»£æ›¿ç³–å—?”在事实性幻觉的情况下,AI大模型å¯èƒ½ä¼šå‘Šè¯‰ç”¨æˆ·ï¼Œ“是的”,然åŽä»‹ç»èœ‚蜜是天然的,å¯ä»¥å¸®åŠ©ç³–å°¿ç—…æ‚£è€…ç¨³å®šè¡€ç³–æ°´å¹³ã€‚“但其实这个是错的,蜂蜜也是å‡ç³–的。”陈钟解释é“。
è€Œåœ¨å¿ å®žæ€§å¹»è§‰æƒ…å†µä¸‹ï¼ŒAI大模型å¯èƒ½ä¼šå›žç”,蜂蜜富å«å¾®ç”Ÿç‰©å’ŒçŸ¿ç‰©è´¨ï¼Œå¯¹æé«˜å…ç–«åŠ›å¾ˆæœ‰å¸®åŠ©ï¼Œå› æ¤æ˜¯ä¸€ç§å¥åº·çš„食å“。“大模型给出的这å¥è¯æ˜¯å¯¹çš„ï¼Œä½†æ˜¯æˆ‘å¹¶æ²¡æœ‰é—®å®ƒèœ‚èœœæ˜¯ä¸æ˜¯å¥åº·é£Ÿå“,我是想问它糖尿病患者能ä¸èƒ½åƒè¿™ä»¶äº‹ã€‚”陈钟进一æ¥è¡¥å……é“。
引导AIå‘善的治ç†å®žè·µ
针对AI大模型伴éšçš„相关问题,国际层é¢å¹¿æ³›é‡è§†å¹¶é‡‡å–了多项行动。
在刚刚结æŸçš„世界互è”网大会上,《为人类共åŒç¦ç¥‰æž„建全çƒäººå·¥æ™ºèƒ½å®‰å…¨ä¸Žæ²»ç†ä½“系》报告æ£å¼å‘布,æå‡ºäº†ä»¥è”åˆå›½ä¸ºä¸å¿ƒæž„建全çƒäººå·¥æ™ºèƒ½å®‰å…¨æ²»ç†ä½“系的机制举措与政ç–建议。近年æ¥ï¼Œæˆ‘国积æžé€šè¿‡ã€Šç”Ÿæˆå¼äººå·¥æ™ºèƒ½æœåŠ¡ç®¡ç†æš‚行办法》《人工智能生æˆåˆæˆå†…å®¹æ ‡è¯†åŠžæ³•ã€‹ç‰æ³•律法规,探索建立生æˆåˆæˆå†…å®¹æ ‡è¯†ã€å®‰å…¨è¯„ä¼°ç‰åˆ¶åº¦ï¼Œæ¥æœ‰æ•ˆé˜²èŒƒç›¸å…³é£Žé™©ã€‚
实践层é¢ï¼Œä¸å¤®ç½‘信办牵头,在全国范围内开展“清朗·æ•´æ²»AI技术滥用”专项行动,通过强化AI技术æºå¤´æ²»ç†ã€èšç„¦åˆ©ç”¨AIæŠ€æœ¯åˆ¶ä½œè¿æ³•ä¸è‰¯ä¿¡æ¯ç‰ï¼Œé˜²èŒƒAIæŠ€æœ¯æ»¥ç”¨ï¼Œç»´æŠ¤ç½‘æ°‘åˆæ³•æƒç›Šã€‚
å›½é™…è§†è§’ï¼Œè¿‘æ—¥ï¼Œæ—¥æœ¬æ”¿åºœå…¬å¸ƒäººå·¥æ™ºèƒ½åˆ©ç”¨æŒ‡é’ˆè‰æ¡ˆï¼Œè¦æ±‚ä¼ä¸šç§¯æžå…¬å¼€ä¿¡æ¯ã€é˜²æ¢é«˜åº¦ä»¿çœŸçš„“æ·±åº¦ä¼ªé€ ”图åƒç‰ä¸å½“内容扩散,并呼å公众æ£ç¡®ç†è§£AI特性åŠå…¶æ½œåœ¨é£Žé™©ï¼Œå¦‚åè§ä¸ŽçŠ¯ç½ªç”¨é€”ã€‚
è”åˆå›½åˆ™äºŽå޻年3月通过了《抓ä½å®‰å…¨ã€å¯é 和值得信赖的人工智能系统带æ¥çš„æœºé‡ï¼Œä¿ƒè¿›å¯æŒç»å‘å±•ã€‹å†³è®®ã€‚æ¬§ç›Ÿä¹Ÿä»¥ã€Šäººå·¥æ™ºèƒ½æ³•ã€‹ä¸ºæ ¸å¿ƒæ²»ç†æ¡†æž¶ï¼Œé€šè¿‡æž„建风险分级管控与伦ç†å®¡æŸ¥å¹¶è¡Œçš„åŒé‡æœºåˆ¶ï¼Œåœ¨ç»´æŠ¤å®‰å…¨åº•çº¿çš„åŒæ—¶ä¸ºäººå·¥æ™ºèƒ½æŠ€æœ¯åˆ›æ–°ä¿ç•™å‘展空间。
用户何去何从?
陈钟进一æ¥åˆ†äº«äº†ç”¨æˆ·å¦‚何应对AI大模型幻觉率高的方法。
ä»–æŒ‡å‡ºï¼Œæ ¸å¿ƒåœ¨äºŽæé«˜ç§‘æŠ€ç´ å…»ã€‚è¦ä¸»åŠ¨æ‹¥æŠ±æ–°æŠ€æœ¯ï¼Œæ·±å…¥äº†è§£å¤§è¯è¨€æ¨¡åž‹çš„计算原ç†ç©¶ç«Ÿæ˜¯ä»€ä¹ˆã€‚在具体æ“作层é¢ï¼Œä»–表示,对于åªéœ€è¦ç”¨åŸºç¡€æ¨¡åž‹å°±èƒ½è§£å†³æˆ–者回ç”的问题,尽é‡å°‘ç”¨æŽ¨ç†æ¨¡åž‹ã€‚å¦‚æžœå¿…é¡»ç”¨åˆ°æŽ¨ç†æ¨¡åž‹ï¼Œåˆ™å¯ä»¥é€šè¿‡ä»¥ä¸‹å‡ ç§æ–¹å¼å°½å¯èƒ½åœ°é™ä½Žå¹»è§‰çŽ‡ã€‚
一是æå‡ºç›¸åº”çš„çº¦æŸæ¡ä»¶ï¼Œå°½å¯èƒ½é¿å…大è¯è¨€æ¨¡åž‹æœç€æ²¡æœ‰çº¦æŸçš„æ–¹å‘引出相应的幻觉;二是对比åŒä¸€é—®é¢˜ä¸åŒæ¨¡åž‹ç»™å‡ºçš„ç”æ¡ˆï¼ŒæŽŒæ¡å¹»è§‰çŽ‡é«˜å’Œä½Žçš„æ¨¡åž‹é—´çš„å·®å¼‚ã€‚
在æ¤åŸºç¡€ä¸Šï¼Œé™ˆé’Ÿè®¤ä¸ºæœ€é‡è¦çš„一点是如果所需è¦çš„ç”æ¡ˆå¯¹äºŽçœŸå®žæ€§å’Œå‡†ç¡®æ€§çš„è¦æ±‚æžé«˜ï¼Œä¸€å®šè¦é€šè¿‡äººå·¥çš„æ–¹å¼å夿 ¸æŸ¥æ ¸éªŒï¼Œè€Œä¸æ˜¯ç®€å•地相信AI模型给出的结果,并直接引用。
在æ¤å±‚é¢ï¼Œä¸åŽå¥³åå¦é™¢åª’ä»‹ä¸Žå¥³æ€§ç ”ç©¶é™¢ä¸»ä»»ã€å‰¯æ•™æŽˆã€ç ”究生导师ã€ã€ŠAI时代èŒåœºä¸Žå®¶åºçš„åŒèµ¢å¯†ç 》作者刘旸也给出了é’少年安全åˆç†ä½¿ç”¨AI工具的建议。家åºå±‚é¢ï¼Œå®¶é•¿åº”å°½é‡å¼•导é’å°‘å¹´ä¸è¦ç›´æŽ¥ç…§æ¬AI工具生æˆçš„ç”æ¡ˆï¼Œè€Œæ˜¯æŸ¥çœ‹å…¶æ€è€ƒè¿‡ç¨‹ï¼›æˆ–者说,针对æŸé“ä¸ä¼šçš„题目,å¯ä»¥è®©AIå†ç”Ÿæˆä¸€é“åŒç±»åž‹çš„其他题目,从而实现继ç»å¦ä¹ ã€å¢žå¼ºè®°å¿†çš„æ•ˆæžœã€‚é’少年自身对于AI生æˆçš„内容也è¦ä¿æŒåˆç†çš„è¦æƒ•,ä¸è¦ä¸€å‘³åœ°å®Œå…¨ç›¸ä¿¡ï¼Œå¯ä»¥é€šè¿‡äº¤å‰éªŒè¯ï¼ˆç”¨å¤šä¸ªä¿¡æ¯æ¥æºæ ¸å¯¹ï¼‰ã€è¿½æº¯ä¿¡æºï¼ˆè®©AIæä¾›ä¿¡æ¯æ¥æºï¼‰ã€è¿ç”¨æ‰¹åˆ¤æ€§æ€ç»´ï¼ˆè¿™ä¸ªç”案符åˆå¸¸è¯†å’Œé€»è¾‘å—ï¼Ÿï¼‰ç‰æ–¹æ³•æ¥ä¸»åŠ¨è¾¨åˆ«AI生æˆå†…容的真伪。
è°ˆåŠä»Žæ ¹æºä¸Šé™ä½ŽAI大模型生æˆå†…容的幻觉率,陈钟呼å,最主è¦çš„还是è¦é 大è¯è¨€æ¨¡åž‹çš„å¼€å‘è€…ï¼Œä»ŽæŠ€æœ¯æ‰‹æ®µåˆ›æ–°å±‚é¢æ¥è§£å†³ç›¸åº”的问题。
一些主æµçš„AI大模型厂商,已ç»é‡‡å–了相应措施,从技术层é¢ç‘牢AI幻觉的防御墙。新åŽç½‘çš„æŠ¥é“æåˆ°ï¼Œè±†åŒ…å‡çº§äº†æ·±åº¦æ€è€ƒåŠŸèƒ½ï¼Œç”±å…ˆæœåŽæƒ³å˜ä¸ºè¾¹æƒ³è¾¹æœï¼Œæ€è€ƒè¿‡ç¨‹ä¸å¯ä»¥åŸºäºŽæŽ¨ç†å¤šæ¬¡è°ƒç”¨å·¥å…·ã€æœç´¢ä¿¡æ¯ï¼Œå›žå¤è´¨é‡æ˜Žæ˜¾æå‡ï¼›é€šä¹‰åƒé—®åœ¨20多个通用任务上应用强化å¦ä¹ ï¼Œå¢žå¼ºé€šç”¨èƒ½åŠ›çš„åŒæ—¶çº æ£ä¸è‰¯è¡Œä¸ºï¼›å…ƒå®æŒç»æ‰©å……引入å„领域的æƒå¨ä¿¡æºï¼Œåœ¨å›žç”æ—¶äº¤å‰æ ¡éªŒç›¸å…³ä¿¡æ¯ï¼Œæé«˜ç”Ÿæˆå†…容的å¯é 性。
AI幻觉的治ç†ä¹‹è·¯ï¼Œæ—¢æ˜¯æŠ€æœ¯è¿ä»£çš„æŽ¢ç´¢ï¼Œä¹Ÿæ˜¯äººä¸Žæ™ºèƒ½ååŒçš„修行。唯有æŒç»å¼ºåŒ–æŠ€æœ¯ç ”å‘ã€å¥å…¨è§„范体系ã€å®Œå–„æ ¡éªŒæœºåˆ¶ï¼Œæ–¹èƒ½ä»Žæ ¹æºä¸Šé制幻觉风险,ç‘牢AI应用的å¯é 底线。当AI工具摆脱“虚妄”的桎æ¢ï¼Œä»¥æ›´å®‰å…¨ã€ç²¾å‡†çš„å§¿æ€èžå…¥ç”Ÿäº§ç”Ÿæ´»å„领域,人工智能技术在赋能社会进æ¥ã€å¢žè¿›æ°‘生ç¦ç¥‰æ–¹é¢çš„é‡è¦æ„义æ‰å°†æŒç»æ”¾å¤§ã€‚
ï¼ˆæ¥æºï¼šåŒ—京科技报)
|