THE CHINESE BOOK
FOR LARGE LANGUAGE MODELS
大语言模型
Copyright © RUC AI Box赵鑫 李军毅 周昆 唐天一 文继荣 著భ
2022୍ָđChatGPT ᆑݪഈཌđնეଆඌo༜जpਔᆜ۱ഠ߶đದ
۽ᇆିඌၹՎ႒টਔ၂Ցᇗေࣉᅚb૫ؓնეଆ఼֥նྟିđૌ҂࣌ေ
໙ğᆦӪᆃུଆ֥Мުඌ࣮ࣨ൞હĤᆃ၂໙ีၐӮູਔᇙ؟॓ದჴ֥
නॉׄࢊb
сྶᆷԛ֥൞đ նଆඌѩ҂൞၂ᵉࣼطđ ఃؿᅚӱᇏ༵ࣜުਔ࠹ე
ଆaപࣜຩეଆaყეଆؿ۱؟֩ᅚ؍ࢨđૄ၂҄ؿ֥ᅚୠ
ࢲਔᇙ؟॓۽ቔᆀ֥ྏ࿓აӮݔbቔູնეଆඌ֥ᇗေᆀđ OpenAI
܄ඳႄਵਔЧՑඌэ۪đಞૌᄜՑܤ߭ఃᆌؓնଆඌ֥ؿӱb 2015
୍đOpenAI܄ඳᆞൔԷ৫đषฐ෬๙Ⴈದ۽ᇆି֥ඌਫ਼ཌbᄪ௹֥ OpenAI
ؒຶಡ఼߄࿐༝a؟ଆaეଆ۱ࠫ֩ᇗေٚཟࣉྛਔധೆ࣮bఃᇏđႮ
Ilya Sutskever ਵ֥֝ؒᇶေܱᇿეଆ֥࣮bۣܡ֒ 2017୍ԛࠎႿᇿၩ
৯ࠏᇅ֥ Transformer ଆުđ OpenAIؒ׳ҳ֞ਔఃమᄝ֥Ⴊᄀྟđಪູᆃ
ᇕଆॖି൞၂ᇕնܿଆॖঔᅚ֥མܒࡏbࠎႿՎđ OpenAIؒषࡹܒ
GPT༢ਙଆđѩႿ 2018୍ԛਔֻ၂ս GPTଆ—GPT-1đିܔ๙ݖo ๙Ⴈ໓
Ч-หקༀັט p֥ٓൔಀࢳथ༯Ⴓༀbࢤ༯টđ GPT-2ބGPT-3ଆ๙
ݖঔնყඔऌބଆҕඔܿଆđཁᇷิശਔଆྟିđѩಒ৫ਔࠎႿሱಖ
ეྙൔ֥๙Ⴈༀࢳथਫ਼ࣥbᄝ GPT-3ࠎ֥Ԥഈđ OpenAIႻ๙ݖսaದ
োؓఊa۽ऎႨ֩ඌؓႿଆྟି҂؎ശࠩđԛਔۿି఼ն֥ GPT-3.5༢
ਙଆb 2022୍11ᄅđChatGPT ᆞൔഈཌđିܔၛ߅ؓྙൔࢳथ؟ᇕༀđ֤
Ⴈିܔ๙ݖຩ APIุဒ֞ეଆ఼֥նۿିb 2023୍3ᄅđOpenAIԛਔ
ѓᆽྟ֥ GPT-4ଆđࡼଆି৯ิശᇀಆྍ؇ۚđѩࡼఃঔᅚᇀႚႵ؟ଆۿ
ି֥GPT-4Vଆb
ّܴGPT༢ਙଆؿ֥ᅚӱđႵਆׄದႆའധख़bֻ၂ׄ൞ॖຉᅚ֥
ܒࡏა࿐༝ٓൔğ Transformer ܒࡏିܔຉᅚ֞Ϥၡa తၡമᇀຣၡҕඔܿଆđ ѩ
ࡼყༀ၂ູ ყҩ༯၂۱Ս ᆃ၂๙Ⴈ࿐༝ٓൔĠׄؽֻ൞ؓႿඔऌᇉਈ
აඔऌܿଆ֥ᇗ൪ğ҂Ⴟ BERTൈս֥ყეଆđᆃՑնეଆ֥Ӯ
ۿაඔऌႵሢ۷ູࣅૡܱ֥༢đۚᇉਈඔऌaӑնܿଆඔऌӮູնეଆܱ֥
ࠎԤbഈඍ֥නਫ਼ुරࡥֆđିܔՖᄪ௹ᇙ֥؟ඌਫ਼ཌᇏ࿙ᅳ֞ᆃ่ਫ਼ཌđѩֹקࡔಀᆳྛᆃ่ਫ਼ཌđᆃࣼ൞ OpenAIӮܱ֥ۿ෮ᄝbܤ߭ OpenAI֥ᄪ
௹ં໓đൌ࠽ഈᄪᄝ GPT-2֥ં໓ᇏđࣼധೆษંਔࠎႿնܿଆ໓Чყ֥๙
Ⴈༀ࿐༝ٓൔđಞದ҂ۋ࣌ฑ OpenAI֥ؒඌభᅑྟbෙಖᆃᇕ࣮ଆൔޓ
گᇅđ൞ᆴ֤ૌಀනॉa࿐༝b
OpenAIؒሱ GPT-3षđޓࣼഒᄝ܄ष֥ҋਘᇏิࠣཌྷܱඌ༥ࢫđޓ
؟ඌБۡᇶေ൞ࢺകҩཌྷ֥ܱଽಸb֞ଢభູᆸđܱႿ GPT༢ਙଆނ֥ྏ
ඌಯಖၛປಆࢳૡbෙಖႵᇙ܄؟ඳᄝӇ൫گख़ GPTඣ֥նეଆčೂ
Anthropic aGoogle֩Ď đ൞ᆜุটඪđ OpenAIಯಖᄝնଆඌഈႵሢࢠն֥
ਵ༵ྟb۴ऌ Sam Altman ܄֥षҐࢺ٠കđഉໃؿ֥҃ GPT-5ཌྷбGPT-4߶ࡼႵ
ᇗေ֥ඌࣉ҄bೂݔ൙ൌೂՎđପહ GPT-5֥֞টࡼᄜՑঘնਔა֒భఃն
ეଆ֥ҵएđॖିၩሢದোཟሢ๙Ⴈದ۽ᇆିႻજԛਔᇗေ၂҄b
ཌྷྐႵ؟ޓದ߶Ⴕ၂܋۱֥ၐ໙ğູહ GPTඣ֥նଆĤܱ
ႿູޅGPTࠩљ֥նଆၛđ ྸ؟ದॖି߶൮༵མ֞ෘ৯֥ཋᇅb ಒൌđ ູ
ਔϤၡࠩљ֥ۚඣնଆđ๙ӈླေቋഒϤवࠩљ֥ A100/A800 (80G) ሧ
ჷđطູਔԉٳฐ෬ݖӱᇏ۲֥ᇕ༥ࢫđສສླေႵతवࠩљ֥ A100/A800
(80G)ሧჷቔູᆦӪbؓطႿతၡaຣၡଆটඪđ෮ླေ֥ٮݻෘ৯ሧჷ۷൞ࠞ
ູஔնbଢభđ࿐ඌࢸ૫ਢ֥ᇗն็ᅞ൞ᆇᆞႵԉቀሧჷಀӇ൫ყඌ֥
ؒഒᆭႻഒđၹՎ֝ᇁਔֻ၂൭ࣜဒኇكđၛᆰࢤषᅚཌྷܱ࣮b
նଆടࠣᇙ؟֥༥ࢫđᆃུ༥؟ޓࢫൈީمՖၘႵ॓ં໓ᇏ
ᆰࠆࢤ౼bᄝ࠹࿐༝ൈսđॖၛᆌࠏؓఖ࿐༝ଆࣉྛ٤ӈԉ֥ٳൌᆣ࣮đ২
ೂႨᅅ۬ෆ෬ҕඔ֥ቋႪᆴa࿊ᄴݦނඔaᆳྛࢌҭဒᆣ֩b๙ט֥ܼٗݖႪ
ൌဒđ࣮ದჴޓॹࣼିࠒԉቀ֥ࣜဒđطࣉྙӮؓႿᆃུࠏ࠹ఖ࿐༝
ଆ֥ധೆࢳb൞đնეଆႮႿҕඔᇙ؟aቆگࡱᄖaݖӱ္бࢠ
گᄖđᄪ௹֥ൌဒฐ෬ೂݔ҂ႄೆޅ༵ဒᆩ്đॖି֝߶ᇁᆷඔࠩᄹӉ֥ൌဒ
ඔਈbಖطđགྷൌ౦ঃ൞đ؟ޓ࣮ದჴѩીႵቀ֥ܔሧჷಀປӮ၂Ցປᆜ֥ն
ܿଆყൌဒđᆃ֤ᅧնଆඌֻ֥၂൭ࣜဒэ֤Ⴍູđ۷҂Ⴈඪ
Ֆਬषฐ෬ཌྷܱ॓໙ีđࠞնཋᇅਔ࿐ඌࢸᄝՎՑದ۽শӖᇏ෮ఏ֥֞ቔႨb
ଢభđି৯ࢠ఼֥նეଆࠎЧჷሱ۽ြࢸđᆃ၂൝ෛሢൈ֥ࡗ၍ॖି
߶эࡆ۷֤ૼཁbՖֻ၂൭ࣜဒᇏo Know-How p đؓႿ॓ದჴটඪ٤ӈᇗေđᆺ
ႵࢤԨ֞ඌނྏđҌିᆇᆞࢳଧུ໙ี൞Ⴕၩၬ֥đѩᅳࢳ֞थٚσb
ದྋ༟֥൞đં൞ᄝ࿐ඌߎࢸ൞۽ြࢸđದૌᇯࡶಪ്֞ਔoष٢p֥ᇗေྟđିܔु֞ᄀটᄀ܄֥؟षࠎ֥Ԥଆaඌսၛࠣ࿐ඌં໓đႵ৯ֹ
ਔնଆඌ֥oૼ߄p bᆺႵ๙ݖष܋ބ٢ཚđҌି߸ऊಆದো֥ᇆ߰đ
܋ࣉದ۽ᇆିඌؿ֥ᅚbൌ࠽ഈđ۴ऌགྷႵ܄ष֥ሧਘđնଆඌ္൞
oႵᅣॖ࿖p֥đೂᆜุੀӱaඔऌౢ༡مٚaᆷັטඌaದোொؓݺఊ
ෘ֩مb۴ऌᆃུඌđᄝෘ৯ሧჷᆦӻ༯đؿದჴၘࣜିࢠܔູඨ০ֹປӮ
նଆ֥ᆜุੀӱđѩ౼֤҂հ֥ଆིݔbෛሢނ؟۷ྏඌࢣ֥ൕބष
٢đնଆඌ֥oૼ߄pࣉࡼ၂҄ิۚb
ູਔֹݺ۷ᆜބԮѬնଆඌ֥ቋྍࣉᅚაඌุ༢đૌᄝ 2023୍3
ᄅؿіਔնეଆሸඍ໓ᅣu A Survey of Large Language Models v đѩ҂ࣉ؎ྛ
۷ྍປbᆃሸඍ໓ᅣၘ۷ࣜྍֻ֞ 13۱ϱЧđЇݣਔ 83်֥ᆞ໓ଽಸđѩ
൬ਔ900Ⴥҕॉ໓ངbሱႇ໓ሸඍ໓ᅣഈཌުđ࿃Ⴕᆀ࿘໙൞ڎႵؓႋ
֥ᇏ໓ϱЧbູՎđૌႿ 2023୍8ᄅؿ҃ਔھሸඍč v10Ď֥ᇏ໓يၲϱbᄝ
2023୍12ᄅָđູਔֹݺ۷ิ܂նଆඌ֥ᇏ໓ҕॉሧਘđૌఓਔᇏ໓
֥щཿ۽ቔđѩႿ࣍ರປӮԚ۠bაႇ໓ሸඍ໓ᅣק໊֥҂đᇏ໓ϱ۷ࠡ
ᇿᇗູնଆඌ֥ೆᆀิࢳࢃ܂đູՎૌᄝଽಸഈࣉྛਔն۷֥؇ږྍ
აᇗቆđ৯ᅚགྷ၂۱ᆜุ֥նଆඌॿބࡏਫ਼ཌbЧൡႨႿ ऎႵധ؇࿐
༝ࠎԤ୍֥ۚࠩЧ॓ളၛ୍࣮֮ࠣࠩള Ⴈđॖၛቔູ၂Ч ೆ֥ࠩඌࠡb
ᄝሙСᇏ໓ݖ֥ӱᇏđૌܼٗᄇਔགྷႵׅ֥ࣜં໓aཌྷܱս࢝ބҋđ
Ֆᇏิԛނྏۀaᇶੀෘمაଆđѩࣉྛਔ༢ྟ֥ቆᆮაࢺകbૌؓႿ
ૄ۱ᅣ֥ࢫଽಸԚࣉ۠ྛਔ؟Ցྩᆞđ৯іղ֥ౢ༉ྟაሙಒྟbಖطđᄝ
ཿݖӱᇏđૌധۋሱദି৯აᆩ്֥अཋྟđ࣐ܵၘڱࣜԛਔࠞն֥୭৯đ
૧߶Ⴕ၌ࠇ҂֒ᆭԩbЧ֥Ԛϱࣇ൞၂۱ఏׄđૌ߃࠹ᄝຩഈӻ࿃ࣉྛ
ଽಸ۷֥ྍބປđѩหљߋ႒ᆀิԛЏ֥აࡹၰđ္߶҄ᄝຩᅟഈ
ؓႿิԛЏࡹၰ֥ᆀࣉྛᇁ྆bૌࡼщཿՎݖ֥ӱ֒ቓ၂۱ሱദ֥࿐༝
ݖӱđ္༐ຬିܔ๙ݖЧაᆀࣉྛധೆࢌੀđཟ֥؟۷ྛြྛ࿐༝b
ሹᆭđնଆඌᆞԩႿॹؿᅚ؍ࢨđࠎԤჰታրฐ෬aܱඌታր
ڿbؓႿ॓ದჴطđնଆ۽࣮ቔԉડਔམའॢࡗđದູᆭപສbෛ
ሢඌ֥҂ࣉ؎҄ა܋ཚष٢đૌႵႮཌྷྐđໃটದ۽ᇆିඌࡼ౼۷֤ն
ࣉ֥ᅚđࡼᄝ؟۷ਵთջট۷ູധჹ֥႕ཙb
ቔᆀ
2024୍3ᄅ31ರ
LLMBook 大语言模型
文档预览
中文文档
391 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共391页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-10-13 13:50:40上传分享