>> 國盛證券-計算機行業(yè):微軟COPILOT做PPT需要哪些技術?-230415
| 上傳日期: |
2023/4/16 |
大?。?/td>
| 1169KB |
| 格式: |
pdf 共9頁 |
來源: |
國盛證券 |
| 評級: |
增持 |
作者: |
劉高暢 |
| 行業(yè)名稱: |
計算機 |
| 下載權限: |
無限制-登錄即可下載 |
|
|
微軟365 Copilot發(fā)布,劃時代革新辦公體驗。2023年3月16日晚,微軟發(fā)布基于AI的365 Copilot,內容涵蓋辦公各個領域,其中,PowerPoint中的Copilot可以一鍵生成PPT,將現(xiàn)有的書面文件轉化為帶有演講者筆記和資料來源的演示文稿,或從一個簡單的提示或大綱開始一個新的PPT,點擊一個按鈕就能濃縮冗長的演示文稿,并使用自然語言命令來調整布局、重新編排文本和動畫安排。我們認為,大模型將以全新技術完全革新辦公體驗,大幅提升效率,改善人們生產生活的方式。 拆分Copilot生成PPT的功能,模型多樣化能力提供基礎。拆分現(xiàn)階段Copilot生成PPT的功能,我們認為,想要達到Copilot的效果,模型需要具備的基礎能力包括文本摘要、文本生成、視覺示例顯示、修改圖片等。1)文本摘要:可以協(xié)助理解文檔內容,分段、總結,并生成PPT大綱或演講備注。文本摘要為生成式AI較為基礎的能力之一,早在GPT-2就被訓練來閱讀維基百科的文章,能夠生成文章的摘要;到GPT-4時,將InstructGPT的論文截圖上傳變能夠馬上讀完并寫摘要。2)文本生成:為LLM大模型的基本技能,在PPT場景下,文本生成的應用包括根據(jù)提示的主題增加PPT內容、修改文稿的語氣態(tài)度等。3)視覺示例顯示:KOSMOS-1參數(shù)量僅為16億,能夠原生處理廣泛的感知密集型任務,如視覺對話、視覺解釋、視覺問答、圖像描述生成、簡單的數(shù)學公式、OCR和帶描述的零樣本圖像分類。視覺示例顯示能力若應用在辦公軟件中,可以根據(jù)每頁PPT總結好的文字內容,進行自動配圖、排版。4)修改圖片:Visual ChatGPT可以支持文字+圖片的交互方式。除了可以進行簡單的對話外,Visual ChatGPT還可以接收復雜的視覺問題或視覺編輯指令,用戶還可以給出反饋,并要求修改結果,從而實現(xiàn)更加智能化、人性化的交互體驗。模型修改圖片能力應用在辦公軟件中,可以根據(jù)文字指令,修改PPT的配圖或排版,增加簡單的動畫效果。 國產大模型加速入局,辦公領域落地未來可期。國內互聯(lián)網及AI廠商在大模型領域相繼布局,在文本摘要、文本生成、文生圖等上述必需能力方面已經有了較大進展,為模型應用于PPT等辦公軟件打下基礎。1)通用PPT:3月27日,百度智能云開啟閉門交流會,文心千帆展示生成通用PPT的能力。根據(jù)紅點新聞報道,工作人員輸入“長安逸達汽車介紹,不超過10頁PPT”后,文心千帆自動生成了一個比較通用的PPT,隨后工作人員因PPT內容不完整輸入了鏈接,讓文心千帆通過這個鏈接來修改PPT內容。結果只花三分鐘,就做出了一份既有亮點,也有圖片的格式精美、內容豐富的PPT。2)文本摘要:根據(jù)阿里云峰會,釘釘接入“通義千問”測試之后,可以自動生成工作方案,也可以在會議紀要后自動生成總結和待辦事項。3)文生圖:騰訊基于自身在自然語言處理和圖像多模態(tài)等方面積累的經驗,采用stable diffusio和Imagen兩套模型并行研發(fā)的方案,打造了通用場景的太極文生圖大模型;與此同時,商湯文生圖大模型擁有超10億參數(shù),支持二次元、三次元等多種生成風格,用戶無需復雜的編程知識,只需給定提示詞即可生成相應圖像,最高可實現(xiàn)6K高清圖,每2秒就能生成1張512*512分辨率的圖片。我們認為,隨著國產大模型的加速布局,文本摘要、文本生成、文生圖等技能的逐步進步,國內大模型辦公領域落地未來可期。 投資建議:辦公相關:金山辦公、彩訊股份、微軟等。 風險提示:AI技術迭代不及預期、經濟下行超預期風險、行業(yè)競爭加劇風險。
|
|