12日,Microsoft發佈了一個新的大型語言模型,計劃爲 Excel、谷歌 Sheets 等電子表格應用程序開發全新的 AI 大語言模型--SpreadsheetLLM。
Microsoft在論文指出,SpreadsheetLLM作爲一款全新的AI模型,將廣泛使用於理解和處理但複雜的電子表格數據。
SpreadsheetLLM具有改變電子表格數據管理和分析的潛力,爲更智能和高效的用戶交互鋪平了道路。
這或許會讓會計師和數據分析師們對他們的未來工作前景感到擔憂。網友們在社交平台X上調侃,認爲“凱倫的工作很快就會被人工智能取代”。
“凱倫可能很快就會失業”
研究人員指出,當前的電子表格應用程序功能豐富,在佈局和格式方面爲用戶提供了大量選擇,這使得傳統的 AI 大語言模型難以在電子表格處理方面發揮作用。而 SpreadsheetLLM 就是專門爲電子表格應用而設計的 AI 模型。
微軟還開發了 SheetCompressor(壓縮電子表格)工具,以幫助 SpreadsheetLLM 更好地理解和處理電子表格數據。
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-0-ad86f3ffa7e347c6d6888f38d64ef2be.png/big)
研究人員稱,SpreadsheetLLM 的潛在應用非常廣泛,從自動執行日常數據分析任務,到提供基於電子表格數據的智能見解和建議。例如,SpreadsheetLLM 可用於自動生成財務報告、識別數據中的異常或趨勢、爲客戶提供個性化的產品或服務推薦等。
因此,SpreadsheetLLM 有可能徹底改變企業處理數據的方式。
一位用戶聲稱:“正如我們所知,能夠編寫 SQL 的 LLM 將扼殺整個數據工程行業。”
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-1-0cf1cc56afa42928bf842dd0d7906894.png/big)
另一位寫道,“SaaS陷入了深深的麻煩。”
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-2-b603509e2baf127e26d3d34c4ca1e310.png/big)
“這對金融界來說將產生巨大影響”
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-3-afd4c12fc7a9f08b91e83108607279c2.png/big)
賓夕法尼亞大學沃頓商學院副教授伊桑·莫利克(Ethan Mollick)在推特上寫道:“這再次表明 LLM 很快就能處理結構化和非結構化電子表格數據。這將解鎖許多用例(預測、財務、估值等),並且擁有電子表格真實來源往往會減少幻覺。”
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-4-d195488e366d804579bc708d5684226c.png/big)
SpreadsheetLLM如何工作?
SpreadsheetLLM通過將電子表格數據編碼爲大型語言模型(LLM)可以理解的格式,從而使LLM能夠對電子表格數據進行推理、回答有關數據的問題,甚至根據自然語言提示生成新的電子表格。
SpreadsheetLLM的核心是“SheetCompressor”框架,該框架可以有效地壓縮和編碼電子表格數據,使其更易於LLM處理。SheetCompressor由三個模塊組成:
▲基於結構錨點的壓縮:在整個電子表格中放置“結構錨點”,以幫助LLM理解數據結構。
▲逆索引翻譯:將電子表格轉換爲更緊湊的格式,並消除冗餘數據。
▲數據格式感知聚合:根據數字格式和數據類型對相鄰單元格進行分組。
![big](https://usnewsfile.moomoo.com/public/MM-PersistNewsContentImage/7781/20240716/0-3256eff84b12554d4d21b7a082bdebab-5-d41b4377db2c74116fc3cdfe2f7febc1.png/big)
SHEETCOMPRESSOR 框架的插圖(圖片:Microsoft)
Microsoft稱,SpreadsheetLLM顯着提高了電子表格檢測任務的性能,在 GPT4 的上下文學習設置中比普通方法高出 25.6%,使用詞元(token)的成本降低了 96%,並能提供更好的處理結果。
目前,Microsoft還沒有公佈何時向公衆發佈SpreadsheetLLM 的消息。該論文指出,該模型仍有一些限制,如對於複雜或結構化程度高的數據,其理解能力仍然有限;SheetCompressor目前還不能壓縮包含自然語言的單元格等等。