六月天色婷婷_免费一级suv好看的国产网站_国产你懂的在线观看_国产一区二区三区视频播放_国产欧美一区二区在线观看_天天干夜夜嗨

首頁 > 以車會友 > 以車會友 > DeepSeek開源新模型,用視覺方式壓縮一切

DeepSeek開源新模型,用視覺方式壓縮一切

發布時間:2025-10-21 17:16:58

10月20日,DeepSeek再度開源新模型。

在GitHub(https://github.com/deepseek-ai/DeepSeek-OCR)上可以看到其最新模型名為DeepSeek-OCR,還是一款OCR(光學字符識別)模型,該模型的參數量為3B。

該項目由 DeepSeek 三位研究員 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。其中一作 Haoran Wei 曾在階躍星辰工作過,曾主導開發了旨在實現「第二代 OCR」的 GOT-OCR2.0 系統(arXiv:2409.01704),該項目已在 GitHub 收獲了超 7800 star。也因此,由其主導 DeepSeek 的 OCR 項目也在情理之中。

圖片

DeepSeek 表示,DeepSeek-OCR 模型是通過光學二維映射(將文本內容壓縮到視覺像素中)來高效壓縮長文本上下文。

該模型主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解碼器兩大核心組件構成。其中 DeepEncoder 作為核心引擎,既能保持高分辨率輸入下的低激活狀態,又能實現高壓縮比,從而生成數量適中的視覺 token。

實驗數據顯示,當文本 token 數量在視覺 token 的 10 倍以內(即壓縮率 <10×)時,模型的解碼(OCR)精度可達 97%;即使在壓縮率達到 20× 的情況下,OCR 準確率仍保持在約 60%。

這一結果顯示出該方法在長上下文壓縮和 LLM 的記憶遺忘機制等研究方向上具有相當潛力。

此外,DeepSeek-OCR 還展現出很高的實用價值。在 OmniDocBench 基準測試中,它僅使用 100 個視覺 token 就超過了 GOT-OCR2.0(每頁 256 個 token) 的表現;同時,使用不到 800 個視覺 token 就優于 MinerU2.0(平均每頁超過 6000 個 token)。在實際生產環境中,單張 A100-40G GPU 每天可生成超過 20 萬頁(200k+) 的 LLM/VLM 訓練數據。

DeepSeek 探索的方法概括起來就是:利用視覺模態作為文本信息的高效壓縮媒介。

簡而言之,一張包含文檔文本的圖像可以用比等效文本少得多的 Token 來表示豐富的信息,這表明:通過視覺 Token 進行光學壓縮可以實現高得多的壓縮率。

基于這一洞見,DeepSeek 從以 LLM 為中心的視角重新審視了視覺語言模型 (VLM),其中,他們的研究重點是:視覺編碼器如何提升 LLM 處理文本信息的效率,而非人類已擅長的基本視覺問答 (VQA) 任務。DeepSeek 表示,OCR 任務作為連接視覺和語言的中間模態,為這種視覺 - 文本壓縮范式提供了理想的試驗平臺,因為它在視覺和文本表示之間建立了自然的壓縮 - 解壓縮映射,同時提供了可量化的評估指標。

鑒于此,DeepSeek-OCR 便由此而生。這是一個為實現高效視覺 - 文本壓縮而設計的 VLM。

如圖所示,DeepSeek-OCR 采用了一個統一的端到端 VLM 架構,由一個編碼器和一個解碼器組成。

圖片

以車會友更多>>

鳴潮×水月雨聯動U.C.T.S.耳夾式藍牙耳機上架,299元 官宣!追覓科技攜手央視春晚,春晚同款掃地機獻禮全球華人 內存價格狂飆不止!手機、PC等廠商面臨至暗時刻 消息稱OPPO Find N6手機內置6K級電池,大概率春節后登場 6.32英寸小鋼炮來襲:一加15T入網搭載驍龍8 Elite Gen5,3月見 iPhone 17e或2月發布,起售價預計4499元 抖音:將加大對不實信息、網絡暴力等問題的治理力度 京東外賣加熱餐箱擴大覆蓋11城,科技升溫20°C,全職騎手免費配! 2025 ACM Fellow公布!陳寶權、賈佳亞、梅濤、朱軍等多位華人入選 我學者提出新型量子磁傳感器方案 499元鼠標,雙芯旗艦有啥不一樣? 紅魔11 Air:AI游戲圈搜,哪里不會圈哪里? iPhone18 Pro再次被確認:實體壓感按鍵+單挖孔屏,這次真的變了 精準卡位大廠盲區,小眾App悶聲賺大錢 馬斯克最大算力中心建成了:全球首個GW級超算集群,再創世界紀錄 貴州銀行:以自身信用承接19億存款,信托化險突然受寵 零刻ME Pro:零基礎的小白也能輕松上手 胡馨心確認:REDMI Turbo 5系列能吃上國補 IDC:2025年全球智能手機出貨量達12.6億部,蘋果連續三年第一 IDC:2025全球智能手機出貨12.6億部,蘋果連續三年第一,華為國內登頂 “死了么”APP爆火與改名:照見獨居人群的鏡子 AP2O-Coder 讓大模型擁有「錯題本」,像人類一樣按題型高效刷題 2025開年手機大戰打響!榮耀、一加新機曝光,誰才是真香之選? 本月兩款國產超薄機型問世 榮耀VS聯想moto 你支持誰? 紅米Turbo5 Max!這名字了不得 摩托羅拉新機來了,手寫筆成主角,安卓生態要變天? 摩托羅拉MotoWatch智能手表、Moto Tag 2智能追蹤器渲染圖曝光 全面盤點!一文看懂蘋果2025年發布的超16款新品 華為手機別瞎用!8個設置一關,立馬絲滑到飛起! 10萬級純電SUV二選一,歐拉5與深藍S05誰更能吸引年輕人?
主站蜘蛛池模板: 黄色一级免费 | 91麻豆网 | 色偷偷综合网 | 99国产精品99久久久久久粉嫩 | 国产精品99久久久 | 涩色视频 | 能看黄色的网站 | 天天天天操 | 久久久蜜桃一区二区 | 亚洲三级视频 | 岛国精品在线播放 | 亚洲天堂手机在线 | 亚洲精品一区二区三区在线观看 | 99re这里都是精品 | 四虎成人在线视频 | www,av| 美女啪啪 | www日韩在线 | 特级做a爱片免费69 欧美色图自拍 | 91成人精品一区在线播放 | 神马午夜国产 | 欧美黑人猛交 | 深夜在线视频 | 日韩影院一区二区 | 波多野一区二区 | 久久精品免费看 | 午夜精品久久久久久久 | 免费福利视频在线观看 | 91成人看片 | 国产又粗又黄又爽的视频 | 成人免费视频观看 | 精品一区二区在线观看 | 日韩一级黄色 | 日韩字幕在线观看 | 国产成人在线免费 | 三年中国中文观看免费播放 | 一区二区不卡 | 天堂综合网久久 | 日韩毛片视频 | 国产东北露脸精品视频 | 日本精品一区二区三区视频 |