本書(shū)系統(tǒng)性地介紹了開(kāi)源大模型DeepSeek-V3的核心技術(shù)及其在實(shí)際開(kāi)發(fā)中的深度應(yīng)用。全書(shū)分三部分,共12章,涵蓋理論解析、技術(shù)實(shí)現(xiàn)和應(yīng)用實(shí)踐。第一部分從理論入手,詳細(xì)解析了Transformer與注意力機(jī)制、DeepSeek-V3的核心架構(gòu)與訓(xùn)練技術(shù)等內(nèi)容,并探討了Scaling Laws及其在模型優(yōu)化中的應(yīng)用。第二部分聚焦DeepSeek-V3大模型初步體驗(yàn)、開(kāi)放平臺(tái)與API開(kāi)發(fā)、對(duì)話(huà)生成、代碼補(bǔ)全與定制化模型開(kāi)發(fā)、對(duì)話(huà)前綴續(xù)寫(xiě)、FIM與JSON輸出、函數(shù)回調(diào)與緩存優(yōu)化,以及DeepSeek提示庫(kù)等主題,幫助讀者快速掌握關(guān)鍵技術(shù)的基礎(chǔ)理論和落地實(shí)踐。第三部分則通過(guò)實(shí)際案例剖析DeepSeek在Chat類(lèi)客戶(hù)端、AI助理、VS Code(Visual Studio Code)編程插件等多領(lǐng)域中的集成開(kāi)發(fā),展示了開(kāi)源大模型技術(shù)在工業(yè)與商業(yè)場(chǎng)景中的全面應(yīng)用。
請(qǐng)登錄以后訪(fǎng)問(wèn)所有功能!
登錄
注冊(cè)