>> 中信證券-產(chǎn)業(yè)策略獨(dú)角獸系列報(bào)告-獨(dú)角獸十問十答系列23:打造大模型時(shí)代的AI基礎(chǔ)軟件平臺(tái)-九章云極-230810
| 上傳日期: |
2023/8/10 |
大?。?/td>
| 453KB |
| 格式: |
pdf 共6頁 |
來源: |
中信證券 |
| 評級: |
-- |
作者: |
連一席,沈思越 |
| 下載權(quán)限: |
此報(bào)告為加密報(bào)告 |
|
|
九章云極DataCanvas成立于2013年,以“創(chuàng)造智能,探索未知”為使命,以“助力全球企業(yè)智能升級”為愿景,專注于人工智能基礎(chǔ)軟件的開發(fā)與建設(shè)。作為國家專精特新“小巨人”企業(yè)、人工智能揭榜掛帥企業(yè),公司的核心產(chǎn)品AIFS(人工智能基礎(chǔ)軟件)和DataPilot數(shù)據(jù)領(lǐng)航員集成了一系列先進(jìn)人工智能技術(shù),為企業(yè)提供AI軟件開發(fā)新范式,助力用戶實(shí)現(xiàn)數(shù)智化升級,推動(dòng)政府和企業(yè)AI規(guī)?;瘧?yīng)用。業(yè)務(wù)覆蓋政府、金融、通信、制造、能源、交通、航空等十余個(gè)行業(yè),其中包括多個(gè)行業(yè)頭部和世界五百強(qiáng)企業(yè)。公司2020年被Gartner列入全球AutoML關(guān)鍵供應(yīng)商庫,并連續(xù)三年入選IDC中國機(jī)器學(xué)習(xí)開發(fā)平臺(tái)廠商全國Top3。我們就近日與公司管理層的投資者電話會(huì)交流,結(jié)合公司介紹情況匯總為十問十答。 ▍Q1:公司的核心產(chǎn)品和競爭優(yōu)勢是什么? 公司的核心產(chǎn)品為人工智能應(yīng)用構(gòu)建基礎(chǔ)設(shè)施平臺(tái)AIFoundation Software(AIFS),該平臺(tái)覆蓋了大模型的訓(xùn)練、精調(diào)、壓縮、部署、推理和監(jiān)控以及小模型的全生命周期過程。通過AIFS,公司為客戶提供一系列工具,讓客戶得以開發(fā)、運(yùn)行及管理自己的模型并擁有自主的AI能力。同時(shí),公司也打造了白盒大模型矩陣“九章元識(shí)Alaya”,作為AIFS的核心能力之一。 數(shù)據(jù)方面,公司自研基于大模型的新一代數(shù)據(jù)架構(gòu)工具產(chǎn)品—DataPilot數(shù)據(jù)領(lǐng)航員,具體產(chǎn)品包括DDS數(shù)據(jù)庫實(shí)時(shí)傳輸同步系統(tǒng)、RT實(shí)時(shí)決策中心平臺(tái)、數(shù)據(jù)管道GPT、數(shù)據(jù)查詢GPT、機(jī)器學(xué)習(xí)GPT五大核心組件,幫助用戶實(shí)現(xiàn)數(shù)據(jù)集成、治理、建模、計(jì)算、查詢、分析、機(jī)器學(xué)習(xí)建模全鏈路的智能化。 公司目前已在超300個(gè)的應(yīng)用場景進(jìn)行落地,豐富的落地經(jīng)驗(yàn)及客戶提供的寶貴反饋也構(gòu)筑了公司的核心優(yōu)勢。 ▍Q2:大模型時(shí)代有哪些核心要素?重要性如何排序? 做模型有三個(gè)核心要素:1)算力,2)基礎(chǔ)軟件,3)自己的數(shù)據(jù)。 公司在投資者電話會(huì)交流中表示,總體來說,硬件是同質(zhì)化的,但軟件是差異化的,最后數(shù)據(jù)是邊界,不同的數(shù)據(jù)代表不同的知識(shí)。在同質(zhì)的硬件投入下,軟件會(huì)成為最大的差異化變量,決定模型的質(zhì)量,同時(shí)也決定了成本。 ▍Q3:在大模型時(shí)代,如何理解小模型的價(jià)值? 在大模型時(shí)代,大模型仍然不太可能取代小模型去處理現(xiàn)實(shí)中的很多問題。大模型和小模型常常存在相互關(guān)系,大模型可以將復(fù)雜問題拆解為簡單問題,最后再調(diào)用給小模型,小模型的自身訓(xùn)練也可以受益于大模型。 ▍Q4:怎么看待通用大模型和垂類大模型未來的應(yīng)用場景? 數(shù)據(jù)是有邊界的,因此未來垂類模型的數(shù)量會(huì)非常多,遠(yuǎn)超通用大模型的數(shù)量。垂類模型很多時(shí)候要針對終端應(yīng)用的任務(wù)進(jìn)行調(diào)整,模型的落地會(huì)更多的體現(xiàn)在行業(yè)/企業(yè)垂類的方向,里面會(huì)有企業(yè)/行業(yè)知識(shí)的邊界。 公司在投資者電話會(huì)交流中表示,如果將1000億以上的參數(shù)量作為通用模型的標(biāo)準(zhǔn),那么300-500億參數(shù)可能就是一個(gè)行業(yè)的垂類模型,比如海外的Bloomberg GPT參數(shù)就在500億左右。而Llama用的最多的參數(shù)其實(shí)是在70-100億級別,更像是一個(gè)企業(yè)級大模型。 根據(jù)上面通用、行業(yè)、企業(yè)大模型的分法,正好對應(yīng)了GPU的三檔能力。100億左右的參數(shù)可以用一張消費(fèi)級的顯卡,300億參數(shù)需要一張A100或者A800的卡,1000億參數(shù)則需要八張卡才能跑起來,所以成本相差非常大。 ▍Q5:大模型時(shí)代,國內(nèi)的算力建設(shè)情況如何? 在大模型時(shí)代,算力需求大幅增加,構(gòu)建自主計(jì)算能力的成本也會(huì)隨之上升,因此未來更多的客戶會(huì)選擇租用算力。整體而言,中國已經(jīng)進(jìn)入了大規(guī)模的算力戰(zhàn)略建設(shè)時(shí)代,建設(shè)加速非常明顯。 針對該趨勢,公司提出“云中云”戰(zhàn)略,即把公司的核心能力AIFoundationSoftware嵌入云中(包括公有云、私有云、行業(yè)云和GPUCloud智算中心),從而銷售給更廣大的云使用者。 公司還特別指出,在中國的通用云市場,央企是一個(gè)非常大的變化。過去,互聯(lián)網(wǎng)云是中國公有云市場的主體。但2020年開始,自主可控轉(zhuǎn)型成為重要趨勢?,F(xiàn)在幾乎每一個(gè)央企都有自己的云,包括中國電子、電科、石化、石油等,國資委也提出了“1+N+M”的規(guī)劃,中國電信天翼以及中國移動(dòng)已經(jīng)開始慢慢反轉(zhuǎn)互聯(lián)網(wǎng)云的銷售份額。 ▍Q6:目前市場上已有不少大廠和初創(chuàng)公司入場做大模型,公司為何仍選擇自研九章元識(shí)大模型? 公司的基礎(chǔ)軟件AIFS可以支持客戶去使用市場上不同的白盒模型以實(shí)現(xiàn)自主的AI能力。但與此同時(shí),公司看到目前市場上對于商用授權(quán)(licensing)很友好的純粹白盒模型仍相對空缺,因此仍存在一定空間,這個(gè)市場也被稱為大模型的“安卓”市場。 公司從零開始訓(xùn)練九章元識(shí)大模型,與Llama是并列關(guān)系。九章元識(shí)的最大特點(diǎn)在于多模態(tài),除了語言、文本和圖片以外,還支持結(jié)構(gòu)化數(shù)據(jù),這一點(diǎn)在市場上的競品仍相對較少。此外,公司也在一些技術(shù)細(xì)節(jié)上進(jìn)行創(chuàng)新,包括很好的注意力機(jī)制、更長的上下文窗口(context window)、組合式調(diào)優(yōu)等。 ▍Q7:生成式AI未來會(huì)如何影響數(shù)
|
|