PDF OCR

將掃描 PDF 轉換為可搜尋、可複用的文本工作流。

上傳掃描 PDF

或將檔案拖放到此處

支援格式 PDF本地處理,檔案不上傳

優勢

從掃描件中提取文本

上傳掃描件、執行 OCR、檢視文本、複製或下載。

文字可複用

把掃描頁面轉換為可搜尋的文本工作流。

OCR 進度顯示

識別過程中即時顯示進度。

複製與下載

提供以文本為中心的結果操作。

工作流

OCR PDF 如何融入檔案工作

OCR PDF 可將圖片型檔案轉換為可搜尋、可複用文本。

  1. 1

    上傳掃描 PDF。

  2. 2

    執行 OCR 識別。

  3. 3

    複製或下載提取文本。

OCR PDF 常見問題

怎麼用 OCR PDF 提取文字?

三步:1)上傳你的掃描件或圖片型 PDF;2)選擇識別語言(英文或簡體中文),點選開始 OCR;3)等識別完成後,在結果框裡複製文字,或下載為文本。整個過程在瀏覽器裡跑,不需要安裝軟體或註冊。

識別是在我自己的裝置上完成,還是要上傳到伺服器?

完全在你的瀏覽器本地完成,檔案不會上傳到任何伺服器,也不會離開你的裝置。這意味著合同、證件、發票這類敏感掃描件可以放心處理。代價是速度取決於你電腦的效能,慢一點屬於正常。

有頁數或大小限制嗎?

有。因為是在瀏覽器本地跑,為了不卡死頁面,一次最多處理 3 頁。如果你的 PDF 頁數更多,建議先用拆分工具把需要識別的那幾頁單獨拆出來,再來做 OCR。

支援哪些語言?識別中文嗎?

目前支援英文(eng)和簡體中文(chi_sim)。識別前請選對語言:選中文識別中文掃描件,選英文識別英文件案。語言選錯會明顯影響準確率。暫不支援繁體中文、日文等其他語種。

識別準不準?哪些情況容易出錯?

OCR 不是 100% 準確,效果取決於掃描品質。清晰、對比度高、版面規整、文字端正的掃描件識別得最好;模糊、傾斜、有手寫體、背景花、或者本身就是低解析度照片的,容易出錯或漏字。建議識別完後對照原件快速校對一遍。

輸出是什麼格式?為什麼我的 PDF 文字複製不了?

輸出是純文本——你可以直接複製,或下載成文本檔案,再粘進 Word、Excel 等。注意:掃描件本質是圖片,所以必須先做 OCR 才能選中和搜尋文字;另外有些 PDF 被壓縮或轉成圖片後文字層會丟失,看著像文字其實是圖,這種也得靠 OCR 重新識別。

這個工具收費嗎?

免費。OCR PDF 在你的瀏覽器本地執行,不佔用我們的轉換額度,不需要登入或付費即可使用。

別隻聽我們說——自己驗證

這個工具完全在你的瀏覽器裡執行。你的檔案不會離開你的裝置,也不會上傳到任何伺服器。

自己核實:開啟瀏覽器的開發者工具(F12,或右鍵 → 檢查)→ 切到「Network / 網路」標籤 → 再執行這個工具。你不會看到檔案被上傳到任何地方——處理就發生在你本地的裝置上。