OCR

9件のサービス

AI・深層学習で文書を構造化データに変換するOCR・ドキュメント処理プラットフォーム。PDF解析、多言語対応、LLMパイプライン連携まで。

AI insideは、日本発のAI-OCRサービスを中心としたAIプラットフォーム企業です。主力製品「DX Suite」により、日本語の手書き文字・活字を高精度に認識し、紙文書のデジタル化・業務プロセスの自動化を支援します。

Doclingは、IBM Researchが開発したオープンソースのドキュメントパーシングツールです。PDF、DOCX、PPTX、HTML、画像等の多様なフォーマットをJSON・Markdownに変換し、LLMやRAGパイプラインへの入力データとして活用できるようにします。

Hyperscienceは、AI駆動のインテリジェントドキュメントプロセッシング（IDP）および業務自動化プラットフォームを提供する企業です。機械学習を活用して、手書き・印刷文書からのデータ抽出、分類、検証を高精度に自動化します。

Instabaseは、AIを活用したドキュメント理解・処理プラットフォームを提供する企業です。非構造化ドキュメント（請求書、契約書、フォーム、医療記録等）からデータを自動抽出・分類・検証し、業務プロセスを自動化します。

Markerは、PDFをMarkdown形式に高精度変換するオープンソースツールです。LLMやRAGパイプラインへのドキュメント入力を最適化することを目的として開発されており、テキスト、テーブル、画像、数式などを含む複雑なPDFレイアウトに対応します。

PaddleOCRは、Baidu（百度）が開発したオープンソースのOCRツールキットで、PaddlePaddleディープラーニングフレームワークのエコシステムの一部です。80以上の言語に対応し、軽量かつ高精度なOCRモデル群を提供します。

Rossumは、AIを活用したドキュメントデータキャプチャプラットフォームで、特に請求書・物流書類・発注書などのビジネス文書処理に強みを持つ企業です。手動データ入力を排除し、ドキュメント処理ワークフロー全体を自動化します。

Suryaは、多言語対応のオープンソースOCR・ドキュメント解析ツールです。90以上の言語に対応し、テキスト検出・認識、レイアウト解析、行順序検出などの機能を備えています。

Unstructuredは、LLM（大規模言語モデル）やRAG（Retrieval-Augmented Generation）パイプライン向けに、非構造化データを構造化データへ変換するオープンソースのデータインジェスション/ETLプラットフォームです。