>> 第一上海-AI大模型周報-251022
| 上傳日期: |
2025/10/23 |
大?。?/td>
| 295KB |
| 格式: |
pdf 共3頁 |
來源: |
第一上海 |
| 評級: |
-- |
作者: |
李倩,李京霖,陳曉霞 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
Claude:Anthropic發(fā)佈Claude Haiku 4.5;推出Claude for Life Sciences10月16日,Anthropic發(fā)佈了新模型Claude Haiku 4.5。官方表示該模型以極低的成本提供了接近前沿模型的強大性能,目標成為即時、低延遲任務(wù)(如聊天助手和客戶服務(wù))的理想選擇。Claude Haiku 4.5在模型性能保持高水準的同時,速度更快、價格更便宜。Anthropic表示Haiku 4.5專門針對即時聊天助手、線上客戶服務(wù)代理以及輔助程式設(shè)計工具等需要高回應(yīng)速度的應(yīng)用場景設(shè)計,Haiku4.5編碼性能與Sonnet 4基本持平,但在成本上僅為後者的三分之一,處理速度則提升了超過兩倍。據(jù)介紹,在衡量程式設(shè)計能力的權(quán)威基準測試SWE-bench Verified中,Haiku 4.5取得了73.3%的高分,略微領(lǐng)先於Sonnet 4的72.7%。Haiku 4.5定價為每百萬輸入token 1美元,每百萬輸出token 5美元,比Sonnet 4.5便宜了約三倍。 10月21日,Anthropic宣佈推出面向科研人員的AI產(chǎn)品Claude for Life Sciences,以Anthropic現(xiàn)有的大模型為基礎(chǔ),支援與Benchling、PubMed、10x Genomics等其他科學(xué)工具連接,目標是讓Claude能夠支援從早期發(fā)現(xiàn)到轉(zhuǎn)化和商業(yè)化的整個過程。Anthropic為Claude開發(fā)一系列科學(xué)技能,比如single-cell-rna-qc,對單細胞RNA測序數(shù)據(jù)進行品質(zhì)控制和過濾。Anthropic表示,Claude可用于研究、生成協(xié)定、生物資訊學(xué)和資料分析、臨床和法規(guī)遵從。 Deepseek:發(fā)佈新型視覺壓縮模型DeepSeek-OCR 10月20日,DeepSeek-AI團隊推出DeepSeek-OCR,提出通過視覺模態(tài)壓縮長文本上下文的創(chuàng)新方法,即是把長上下文渲染成一張圖片再喂給模型,讓原本需要數(shù)千上萬個文本token的上下文,只需幾百個視覺token就能表示,實現(xiàn)資訊的高效壓縮。DeepSeek-OCR由核心編碼器DeepEncoder和解碼器DeepSeek3B-MoE-A570M組成。DeepEncoder專為在高解析度輸入下保持低計算啟動而設(shè)計,同時實現(xiàn)高壓縮比,以控制視覺token數(shù)量在可管理的範圍內(nèi)。實驗顯示,當(dāng)文本token數(shù)量不超過視覺token的10倍(壓縮比低於10x)時,模型的OCR(文字識別)精度可達97%;即便壓縮比提高到20x,準確率仍保持約60%,展現(xiàn)出在歷史文檔長上下文壓縮和大語言模型記憶機制研究中的巨大潛力。在實際生產(chǎn)中,DeepSeek-OCR可在單塊A100-40G顯卡上每天生成超過20萬頁的大語言模型/視覺語言模型訓(xùn)練資料。 Gemini:穀歌計畫發(fā)佈Gemini 3.0 10月21日,穀歌公司正在積極籌備Gemini 3.0,近日開始向部分使用者推送Gemini3.0Pro模型。用戶在Gemini網(wǎng)頁應(yīng)用中收到了升級通知,提示已從先前版本升級至"迄今為止最智慧的模型"3.0Pro。模型內(nèi)部代碼標識為"gemini-beta-3.0-pro"。技術(shù)層面,Gemini3.0Pro在前代Gemini2.5Pro的基礎(chǔ)上引入了"Deep Think"推理架構(gòu),旨在提升處理多步驟複雜任務(wù)的能力。模型支援文本、圖像、音訊和視頻等多種輸入格式,能夠即時處理攝像頭輸入,並生成包含完整功能模組的前端代碼。根據(jù)早期測試者的回饋,該模型可以輸出超過2000行的前端代碼,包含載入動畫、回應(yīng)式佈局等實用功能,並具備自主錯誤修復(fù)和多工具協(xié)作優(yōu)化能力。Gemini3.0Pro的知識庫更新至2025年10月,支援即時資料處理和多模態(tài)工具編排,使其能夠執(zhí)行流覽器交互、代碼運行和協(xié)力廠商API調(diào)用等複雜操作,為自動化工作流和企業(yè)級應(yīng)用提供了技術(shù)基礎(chǔ)。 Qwen:通義千問推出長記憶功能Qwen Chat Memory 10月16日,通義千問Qwen通過公眾號宣佈Qwen Chat Memory正式上線,標誌著Qwen擁有“長記憶”,能理解用戶的上下文、保留重要資訊、回憶過往對話。具體來看,其能夠存下與用戶相關(guān)的記憶,並在對話中主動關(guān)聯(lián)上下文。此次推出的“記憶”功能可根據(jù)使用者過去的對話內(nèi)容記住相關(guān)細節(jié),當(dāng)後續(xù)用戶請求回復(fù)時,AI模型將依據(jù)此前的互動經(jīng)驗,提供更貼合個人偏好的答案。
|
|