>> 華鑫證券-計(jì)算機(jī)行業(yè)周報(bào):字節(jié)Seed首次開源代碼模型,鴻蒙電腦搭載鴻蒙AI-250513
| 上傳日期: |
2025/5/14 |
大小: |
1023KB |
| 格式: |
pdf 共15頁 |
來源: |
華鑫證券 |
| 評(píng)級(jí): |
推薦 |
作者: |
寶幼琛 |
| 行業(yè)名稱: |
計(jì)算機(jī) |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
▌算力:算力租賃價(jià)格平穩(wěn),字節(jié)Seed首次開源代碼模型 近日,字節(jié)Seed首次開源代碼模型Seed-Coder,8B規(guī)模,超越Qwen3,拿下多個(gè)SOTA。它證明“只需極少人工參與,LLM就能自行管理代碼訓(xùn)練數(shù)據(jù)”。通過自身生成和篩選高質(zhì)量訓(xùn)練數(shù)據(jù),可大幅提升模型代碼生成能力,這可以被視為對(duì)DeepSeek-R1模型自我生成和篩選訓(xùn)練數(shù)據(jù)策略的擴(kuò)展。一共包含三個(gè)版本:Base、Instruct、Reasoning,其中,Instruct在編程方面表現(xiàn)出色,拿下兩個(gè)測(cè)試基準(zhǔn)SOTA。而推理版本在IOI 2024上超越了QwQ-32B和DeepSeek-R1。 Seed-Coder的前身是doubao-coder,采用Llama 3結(jié)構(gòu),參數(shù)量為8.2B,6層,隱藏層大小為4096,采用分組查詢注意力(GQA)機(jī)制。最關(guān)鍵的工作是數(shù)據(jù)的處理,Seed團(tuán)隊(duì)提出了一種“模型中心”的數(shù)據(jù)處理方式,使用模型來策劃數(shù)據(jù)。具體來說,模型會(huì)從GitHub和網(wǎng)絡(luò)檔案爬取原始代碼數(shù)據(jù),經(jīng)過幾個(gè)處理步驟后輸出最終的預(yù)訓(xùn)練數(shù)據(jù)。 基于基礎(chǔ)模型,Seed團(tuán)隊(duì)還開發(fā)了Seed-Coder的兩個(gè)特殊變體——指令模型(-Instruct):目的是增強(qiáng)模型的指令遵循能力,其訓(xùn)練分為監(jiān)督微調(diào)(SFT)第二階段和直接偏好優(yōu)化(DPO)兩個(gè)階段;推理模型(-Reasoning):目的是提升模型在復(fù)雜編程任務(wù)中的多步推理能力,采用長(zhǎng)鏈條思維(LongCoT)強(qiáng)化學(xué)習(xí)訓(xùn)練。首先使用從編程競(jìng)賽問題和高質(zhì)量模型生成的解決方案進(jìn)行預(yù)熱訓(xùn)練,然后通過GRPO框架實(shí)施強(qiáng)化學(xué)習(xí)訓(xùn)練。這兩個(gè)變體的設(shè)立,進(jìn)一步擴(kuò)展了SeedCoder的實(shí)用性。 ▌AI應(yīng)用:Gemini平均訪問量環(huán)比+8.99%,鴻蒙電腦搭載鴻蒙AI 5月8日上午,華為舉行鴻蒙電腦技術(shù)與生態(tài)溝通會(huì),會(huì)上,華為詳細(xì)介紹了歷時(shí)五年研發(fā)的鴻蒙電腦,并預(yù)告將于5月19日召開首款鴻蒙電腦新品發(fā)布會(huì)。鴻蒙電腦從內(nèi)核層實(shí)現(xiàn)全棧自研,在性能、安全及互聯(lián)體驗(yàn)上實(shí)現(xiàn)突破,更重要的是,其為國(guó)產(chǎn)軟件提供了全新發(fā)展空間——國(guó)產(chǎn)軟件無需被動(dòng)適配,能夠主動(dòng)構(gòu)建自身生態(tài)規(guī)則。 目前,超150個(gè)專屬電腦生態(tài)應(yīng)用加速適配,超300個(gè)融合生態(tài)應(yīng)用已完成適配,預(yù)計(jì)年底支持超2000個(gè),覆蓋辦公、設(shè)計(jì)等核心場(chǎng)景。小紅書、B站、飛書等已適配鴻蒙電腦端,用戶可享移動(dòng)端內(nèi)容與電腦大屏鍵鼠的高效操作?!耙粦?yīng)用,全場(chǎng)景”體驗(yàn)提升用戶粘性,為開發(fā)者開辟增量市場(chǎng)。飛書借鴻蒙“一次開發(fā),多端部署”特性,僅一周完成電腦端基礎(chǔ)適配,實(shí)現(xiàn)移動(dòng)端與電腦端功能同步,讓開發(fā)者聚焦創(chuàng)新,降低生態(tài)構(gòu)建門檻。 鴻蒙電腦的亮相,標(biāo)志著國(guó)產(chǎn)操作系統(tǒng)終于邁出了從“可用”到“好用”的關(guān)鍵一步。它不再只是技術(shù)的堆砌,而是生態(tài)的重構(gòu)。 ▌AI融資動(dòng)向:AI編程獨(dú)角獸獲9億美元融資,估值達(dá)90億 5月6日,AI代碼編輯器初創(chuàng)公司Anysphere據(jù)報(bào)道已完成9億美元融資。此輪融資由Thrive Capital領(lǐng)投,AndreessenHorowitz和Accel等知名機(jī)構(gòu)跟投。公司估值從今年1月的25億美元大幅攀升至90億美元。Anysphere的年度經(jīng)常性收入(ARR)已突破2億美元。 Anysphere的旗艦產(chǎn)品Cursor是一款創(chuàng)新的代碼編輯器,采用分屏界面設(shè)計(jì):一側(cè)顯示用戶代碼,另一側(cè)提供AI聊天機(jī)器人。開發(fā)者可以通過自然語言提示指導(dǎo)AI進(jìn)行代碼修改,底層AI能夠一次生成多行代碼。Cursor具備網(wǎng)絡(luò)搜索和項(xiàng)目文檔查詢能力,可將復(fù)雜任務(wù)分解為更小的步驟。 在技術(shù)層面,Cursor整合了來自O(shè)penAI、Google等供應(yīng)商的語言模型,并于去年推出了自研模型Cursor-Fast。根據(jù)公司描述,該模型的編碼能力介于GPT-3.5和GPT-4之間。最新的招聘信息顯示,Anysphere正在尋求研發(fā)專家混合(MoE)算法,以進(jìn)一步提升AI性能。 值得注意的是,OpenAI此前曾試圖收購(gòu)Anysphere未果,今日也正式與其競(jìng)爭(zhēng)對(duì)手Windsurf(前身為Codeium)達(dá)成收購(gòu)協(xié)議,交易金額約30億美元。這是OpenAI迄今為止規(guī)模最大的一筆收購(gòu)。Windsurf正式名稱為Exafunction Inc.,此前在由General Catalyst領(lǐng)投的融資中估值為12.5億美元。 此次收購(gòu)將幫助OpenAI在AI輔助編程工具市場(chǎng)上應(yīng)對(duì)日益激烈的競(jìng)爭(zhēng)。這個(gè)快速發(fā)展的細(xì)分市場(chǎng)專注于基于自然語言提示來生成代碼的智能系統(tǒng)。目前,OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic和微軟旗下的Github都提供類似的AI編程工具,同時(shí)包括Anysphere在內(nèi)的新興創(chuàng)業(yè)公司也獲得了大量投資。OpenAI最近剛完成由軟銀集團(tuán)領(lǐng)投的400億美元融資,公司估值達(dá)到3000億美元。同時(shí),OpenAI在周一表示,由于面臨公眾壓力,該公司放棄了轉(zhuǎn)型為傳統(tǒng)營(yíng)利性企業(yè)的計(jì)劃。 ▌投資建議 算力方向:據(jù)中國(guó)基金報(bào)報(bào)道,英偉達(dá)或?yàn)閼?yīng)對(duì)出口限制將推出降級(jí)版H20,導(dǎo)致性價(jià)比顯著下滑,關(guān)注國(guó)產(chǎn)替代到長(zhǎng)線機(jī)會(huì)。 應(yīng)用方向:蘋果Safari瀏覽器計(jì)劃引入Perplexity、Anthropic等AI搜索引擎作為可選工具,重構(gòu)應(yīng)用生態(tài),關(guān)注AI應(yīng)用的新機(jī)會(huì)。 中長(zhǎng)期,建議關(guān)注臨床AI產(chǎn)品成功落地驗(yàn)證的嘉和美康( 688246.SH )、以AI為核心的龍頭廠商科大訊飛( 002230.SZ )、芯片技術(shù)有望創(chuàng)新
|
|