>> 申萬宏源-計算機行業(yè)AIGC系列點評:商湯發(fā)布“日日新”大模型,“商量“一下或有驚喜-230411
| 上傳日期: |
2023/4/11 |
大?。?/td>
| 950KB |
| 格式: |
pdf 共7頁 |
來源: |
申萬宏源 |
| 評級: |
看好 |
作者: |
施鑫展,劉洋,洪依真 |
| 行業(yè)名稱: |
計算機 |
| 下載權限: |
此報告為加密報告 |
|
|
本期投資提示: 事件:2023年4月10日,商湯科技技術交流日公布“日日新SenseNova”大模型體系,涵蓋自然語言處理、內(nèi)容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力。 日日新”大模型超預期:模型包括文生圖、數(shù)字人、模型研發(fā)等多功能,注重通過多輪對話提升模型理解能力。算力方面:目前擁有2.7w片專用GPU芯片,支持單集群4000卡及5000億稠密參數(shù)大模型訓練以及20個千億參數(shù)超大模型同時訓練,推理效率提升100%同時增量訓練微調(diào)成本降低90%。 中文語言大模型“商量SenseChat:”商量“包含1800億參數(shù),支持超長文本知識理解、互動式多輪對話、知識自動及時更新,具備優(yōu)秀的通過模型理解問題后生成并總結答案能力。 高智能AI代碼助手:提供代碼補全、注釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構、復雜度分析等功能,根據(jù)商湯內(nèi)部測試,代碼編寫效率提升62%,Humaneval測試集一次通過率可以達到40.2%,高于Copilot(基于GPT3.5模型) 擴散模型引爆AIGC應用流行:文生圖創(chuàng)作平臺秒圖,擁有快速推理能力,2秒完成文生圖創(chuàng)作,并且能夠?qū)崟r調(diào)用LoRA模型進行訓練,5分鐘內(nèi)即可定制20張訓練圖片;如影平臺支持生成多語言、多風格的AI數(shù)字人視頻,滿足多場景需求;瓊宇和格物分別展現(xiàn)出大空間和小物體的3D模型生成能力,多模態(tài)能力有望賦能多類垂直場景 積極開放,探索生態(tài)建設:日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,客戶可根據(jù)實際應用需求,調(diào)用日日新SenseNova大模型的各項AI技術能力。 大模型及相關應用仍將持續(xù)作為AICG科技革命的核心1)算力是基礎,大模型的訓練離不開算力支持,豐富的下游應用帶來百倍的增量AI算力需求,算力基建直接受益2)樂觀看待差距,預計國內(nèi)大模型通過快速推出及迭代,年內(nèi)有望迎接開源生態(tài),繼而推動技術平權,帶來下游更多應用場景機會3)推薦關注算力、算法、安全、華為產(chǎn)業(yè)鏈、GPT產(chǎn)業(yè)鏈等相關公司。 綜合評價:商湯對大模型是有know how和多行業(yè)落地經(jīng)驗的,加上AIDC的算力加持,所以不管是LLM大模型還是多模態(tài)大模型都能夠迅速追趕國外領先公司。加上之前在Al多領域(CV,NLP,AI繪畫,數(shù)字人,3D繪圖,決策智能等)的提前布局,讓它在AIGC時代表現(xiàn)出AI行業(yè)引領者的能力。商湯秉持AGI的初心,相信會是國內(nèi)最先達到AGI目標的候選公司之一。 風險提示:大模型技術中美仍存在差異,部分技術尚處于早期實驗室階段。
|
|