當(dāng)前位置：首頁(yè) > 新聞資訊 > 人工智能標(biāo)準(zhǔn) > 大模型專題一：中國(guó)人工智能系列白皮書(shū)——大模型技術(shù)-2023版

大模型專題一：中國(guó)人工智能系列白皮書(shū)——大模型技術(shù)-2023版

來(lái)源：中國(guó)人工智能學(xué)會(huì) 編輯：創(chuàng)澤時(shí)間：2023/12/9 主題：其他 [加盟]

語(yǔ)言大模型由于在大規(guī)模通用領(lǐng)域數(shù)據(jù)預(yù)訓(xùn)練通常缺乏對(duì)特定任務(wù)或領(lǐng)域的知識(shí)，因此需要適配微調(diào)。微調(diào)可以幫助模型更好地適應(yīng)特定需求，如對(duì)敏感數(shù)據(jù)(如醫(yī)療記錄)的處理，同時(shí)不暴露原始數(shù)據(jù)。此外，微調(diào)可以提高部署效率、減少計(jì)算資源需求。指令微調(diào)和參數(shù)高效學(xué)習(xí)是適配微調(diào)的關(guān)鍵技術(shù)。

指令微調(diào)(Instruction Tuning)[21],是一種可以幫助語(yǔ)言大模型實(shí)現(xiàn)人類語(yǔ)言指令遵循的能力，在零樣本設(shè)置中泛化到未見(jiàn)任務(wù)上的學(xué)習(xí)方法。指令微調(diào)學(xué)習(xí)形式與多任務(wù)提示微調(diào)相似，但與提示微調(diào)讓提示適應(yīng)語(yǔ)言大模型并且讓下游任務(wù)對(duì)齊預(yù)訓(xùn)練任務(wù)不同，其是讓語(yǔ)言大模型對(duì)齊理解人類指令并按照指令要求完成任務(wù)，即在給定指令提示的情況下給出特定的回應(yīng)，其中提示可以選擇性包含一條解釋任務(wù)的指令。指令微調(diào)研究涉及指令理解、指令數(shù)據(jù)獲取和指令對(duì)齊等內(nèi)容。

(1)指令理解，指語(yǔ)言大模型準(zhǔn)確理解人類語(yǔ)言指令的能力，是語(yǔ)言大模型執(zhí)行指令完成任務(wù)的前提。為了增強(qiáng)對(duì)指令的理解，許多工作采用多任務(wù)提示方式對(duì)基于指令描述的大量任務(wù)集上對(duì)語(yǔ)言大模型進(jìn)行微調(diào)，如FLAN[50]、InstructGPT[21]等，這些模型在未見(jiàn)的任務(wù)上顯示出優(yōu)越的零樣本性能。

(2)指令數(shù)據(jù)獲取，指如何構(gòu)建包含多樣性的任務(wù)指令數(shù)據(jù)。指令數(shù)據(jù)構(gòu)建常見(jiàn)有三種方式：i)基于公開(kāi)人工標(biāo)注數(shù)據(jù)構(gòu)建，代表指令數(shù)據(jù)集包括1616種不同任務(wù)的Super-Natural Instruction[51]、2000種不同NLP任務(wù)的OPT-IML[52]。ii)借助語(yǔ)言大模型的自動(dòng)生成構(gòu)建，如Unnatural Instructions[53],通過(guò)種子指令作為提示讓語(yǔ)言大模型生成新的指令描述和問(wèn)題，然后再輸入到模型讓其輸出回答。iii)基于人工標(biāo)注方法，如ChatGPT在人工標(biāo)注指令的基礎(chǔ)上通過(guò)GPT-3、InstructGPT等在線平臺(tái)收集用戶真實(shí)指令數(shù)據(jù)。

附件：大模型專題一：中國(guó)人工智能系列白皮書(shū)——大模型技術(shù)-2023版

国产精品91视频-国产精品96久久久久久久-国产精品97-国产精品99-一级黄色免费看-一级黄色欧美

大模型專題一：中國(guó)人工智能系列白皮書(shū)——大模型技術(shù)-2023版

中國(guó)信通院聯(lián)合發(fā)布《數(shù)據(jù)清洗、去標(biāo)識(shí)化、匿名化業(yè)務(wù)規(guī)程（試行）》

深圳市地方標(biāo)準(zhǔn)《多功能智能桿系統(tǒng)施工技術(shù)規(guī)范》

北京市海淀區(qū)人民政府印發(fā)《關(guān)于加快中關(guān)村科學(xué)城人工智能大模型創(chuàng)新發(fā)展的若干措施》的通知

中國(guó)首個(gè)AIGC管理辦法《生成式人工智能服務(wù)管理暫行辦法》

中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院劉剛教授發(fā)布了《中國(guó)新一代人工智能科技產(chǎn)業(yè)發(fā)展 2023》

五大科技倫理十類人工智能倫理準(zhǔn)則

中國(guó)人工智能倫理相關(guān)國(guó)內(nèi)政策法規(guī)文件

人工智能倫理相關(guān)國(guó)際政策

人工智能產(chǎn)業(yè)集群網(wǎng)絡(luò)結(jié)構(gòu)的三個(gè)極點(diǎn)：北京市、廣東省和上海市

中國(guó)人工智能產(chǎn)業(yè)集群分布：京津冀、長(zhǎng)江三角洲、珠江三角洲和川渝地區(qū)

人工智能產(chǎn)業(yè)集群的基本構(gòu)成

《中國(guó)新一代人工智能科技產(chǎn)業(yè)發(fā)展 2023》建設(shè)具有全球競(jìng)爭(zhēng)力的人工智能產(chǎn)業(yè)集群

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)