>> 海通證券-商湯-W(00020.HK)公司報(bào)告:商湯發(fā)布日日新SenseNova 5.0大模型,綜合性能全面對(duì)標(biāo)GPT-4 Turbo-240427
| 上傳日期: |
2024/4/28 |
大?。?/td>
| 1176KB |
| 格式: |
pdf 共9頁(yè) |
來(lái)源: |
海通證券 |
| 評(píng)級(jí): |
優(yōu)于大市 |
作者: |
楊林,楊蒙 |
| 下載權(quán)限: |
此報(bào)告為加密報(bào)告,僅限高級(jí)會(huì)員查看 |
|
|
商湯發(fā)布日日新SenseNova 5.0大模型體系,綜合性能全面對(duì)標(biāo)GPT-4 Turbo。4月23日,商湯科技在上海、深圳等多地舉辦技術(shù)交流日活動(dòng),發(fā)布行業(yè)首個(gè)“云、端、邊”全棧大模型產(chǎn)品矩陣,以滿足不同規(guī)模場(chǎng)景的應(yīng)用需求,并且全新升級(jí)“日日新SenseNova 5.0”大模型體系,其具備更強(qiáng)的知識(shí)、數(shù)學(xué)、推理及代碼能力,綜合性能全面對(duì)標(biāo)GPT-4 Turbo,并在主流客觀評(píng)測(cè)上達(dá)到或超越GPT-4 Turbo?!溉杖招?.0」能力提升主要得益三個(gè)方面:(1)采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理。且推理時(shí)上下文窗口達(dá)到200K左右。(2)基于超過(guò)10TB tokens訓(xùn)練、覆蓋數(shù)千億量級(jí)的邏輯型合成思維鏈數(shù)據(jù)。(3)商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計(jì)的聯(lián)合調(diào)優(yōu)。在文科能力方面,“日日新5.0”的創(chuàng)意寫作能力、推理能力以及總結(jié)能力均大幅提升,相同的中文知識(shí)注入后,可以獲得更好的理解總結(jié)及問(wèn)答,為教育、內(nèi)容產(chǎn)業(yè)等垂直應(yīng)用場(chǎng)景提供有力輔助。在理科能力方面,“日日新5.0”數(shù)理能力、代碼能力及推理能力達(dá)到業(yè)內(nèi)領(lǐng)先水平,為金融、數(shù)據(jù)分析等場(chǎng)景落地提供堅(jiān)實(shí)基礎(chǔ)?!溉杖招?.0」的文生圖能力也有較大提升。本次「日日新5.0」另一大核心指標(biāo)就是多模態(tài)能力,商湯多模態(tài)大模型的圖文感知能力達(dá)到全球領(lǐng)先水平,在權(quán)威綜合基準(zhǔn)測(cè)試MMBench中綜合得分排名首位,在多個(gè)知名多模態(tài)榜單MathVista, AI2D, ChartQA, TextVQA, DocVQA, MMMU取得領(lǐng)先成績(jī)?!溉杖招?.0」在應(yīng)用產(chǎn)品層面也實(shí)現(xiàn)了更卓越的多模態(tài)能力,支持高清長(zhǎng)圖的解析和理解以及文生圖交互式生成,還可以實(shí)現(xiàn)復(fù)雜的跨文檔知識(shí)抽取及總結(jié)問(wèn)答展示,還具備豐富的多模態(tài)交互能力。 率先完成“云端邊”全棧布局:端側(cè)模型位列行業(yè)首位,邊側(cè)推出企業(yè)級(jí)應(yīng)用一體機(jī)。商湯領(lǐng)先業(yè)內(nèi)首次推出“云、端、邊”全棧大模型產(chǎn)品矩陣,公司認(rèn)為,2024年是端側(cè)大模型應(yīng)用的元年,為了滿足移動(dòng)終端用戶對(duì)大模型技術(shù)的應(yīng)用需求,商湯推出日日新·端側(cè)大模型,性能實(shí)現(xiàn)同等尺度性能最優(yōu),跨級(jí)尺度全面領(lǐng)先。商湯還推出端云協(xié)同解決方案,可以通過(guò)智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢(shì),需要聯(lián)網(wǎng)搜索或處理復(fù)雜場(chǎng)景時(shí)分流至云端處理,部分場(chǎng)景端側(cè)處理占比超過(guò)80%,從而顯著降低推理成本。商湯日日新·端側(cè)大語(yǔ)言模型的推理速度達(dá)到了業(yè)內(nèi)最快,可在中端平臺(tái)實(shí)現(xiàn)18.3字/s的平均生成速度,旗艦平臺(tái)更是達(dá)到了78.3字/s。擴(kuò)散模型同樣可在端側(cè)實(shí)現(xiàn)業(yè)內(nèi)最快的推理速度,端側(cè)LDM-AI擴(kuò)圖技術(shù)在某主流平臺(tái)上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬(wàn)像素及以上的高清圖片,支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。目前,商湯端側(cè)業(yè)務(wù)SDK已經(jīng)正式發(fā)布,用戶可以集成體驗(yàn)。對(duì)于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的AI應(yīng)用需求,商湯正式推出企業(yè)級(jí)大模型一體機(jī),可同時(shí)支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負(fù)載50%。 聯(lián)合生態(tài)伙伴創(chuàng)新AI 2.0時(shí)代產(chǎn)品應(yīng)用,打造新質(zhì)生產(chǎn)力。4月23日,商湯科技SenseTime在上海、深圳等多地舉辦技術(shù)交流日活動(dòng),商湯邀請(qǐng)到金山辦公、小米、閱文集團(tuán)、華為等多位生態(tài)伙伴嘉賓,共同探討和交流大模型技術(shù)在辦公、金融、出行等不同領(lǐng)域的應(yīng)用及前景。自2023年起,商湯與金山辦公達(dá)成深度合作,基于“日日新”大模型的卓越代碼生成及工具調(diào)用能力,助力WPS 365打造更高效釋放場(chǎng)景能力的辦公新質(zhì)生產(chǎn)力平臺(tái),為企業(yè)構(gòu)建專屬的“企業(yè)大腦”。金山辦公CEO章慶元表示:“在辦公應(yīng)用場(chǎng)景內(nèi),商湯大模型的表現(xiàn)十分出色,能夠幫助我們的用戶解決辦公中的復(fù)雜問(wèn)題,提升效率?!痹趥€(gè)人出行場(chǎng)景,近期火爆市場(chǎng)的小米汽車SU7的智能車艙中就應(yīng)用了商湯的大模型技術(shù),基于商湯端云大模型解決方案,小米小愛(ài)同學(xué)為車主提供智能化交互體驗(yàn)。小米集團(tuán)小愛(ài)總經(jīng)理王剛在與商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛對(duì)話時(shí)表示:“商湯的云邊端全棧組合,可以很好地賦能和適配小米物聯(lián)網(wǎng)生態(tài)。我們希望與商湯共同為我們的用戶打造更具智能化的產(chǎn)品體驗(yàn)。”商湯還發(fā)布了基于昇騰原生的行業(yè)大模型,共同打造面向金融、醫(yī)療、政務(wù)、代碼等大模型產(chǎn)業(yè)生態(tài)。在自身應(yīng)用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫(yī)、小浣熊家族等產(chǎn)品均有重要更新。 “文生視頻”已在路上,商湯科技堅(jiān)定邁向AGI時(shí)代。在本次技術(shù)交流日最后環(huán)節(jié),商湯科技董事長(zhǎng)兼CEO徐立還帶來(lái)了三段完全由大模型生成的視頻,并強(qiáng)調(diào)文生視頻平臺(tái)對(duì)于人物、動(dòng)作和場(chǎng)景的可控性。商湯科技在文生視頻平臺(tái)方面也取得了技術(shù)突破,未來(lái),通過(guò)輸入一段文字或一個(gè)完整的描述,就可以生成一段視頻,而且人物的服飾、發(fā)型、場(chǎng)景都可以根據(jù)預(yù)先設(shè)定,保持視頻內(nèi)容的連貫性和一致性。在人工智能發(fā)展的最基本法則——尺度定律(Scaling
|
|