Deepseek Ocr
コンテキスト光学圧縮と多言語対応の次世代ドキュメントインテリジェンス。
Please wait while we load the page
DeepSeek OCRは、コンテキスト光学圧縮を利用した2段階のトランスフォーマーベースのドキュメントAIシステムで、最先端のドキュメントインテリジェンスを提供します。高解像度ドキュメントをスリムなビジョントークンに圧縮し、30億パラメータのエキスパート混合モデルでデコードして、100以上の言語でほぼロスレスなテキスト、レイアウト、図の理解を実現します。複雑なレイアウトに対応したGPU効率の良いスループットをサポートし、3000万ページの実際のPDFと合成データで訓練され、レイアウト構造、テーブル、化学(SMILES文字列)、幾何学タスクを保持します。
DeepSeek OCRは主に3つの方法で使用できます:1. GitHubリポジトリをクローンし、6.7 GBのチェックポイントをダウンロードし、PyTorchを設定してローカルでGPU展開。2. OpenAI互換のAPIエンドポイントを介してDeepSeek OCRを呼び出し、画像を送信して構造化テキストを受信。3. OCR出力をJSONに変換し、SMILES文字列をケモインフォマティクスパイプラインにリンク、または図の自動キャプション付けで既存のワークフローに統合。
複雑なレイアウトと多言語を高精度で処理する次世代のドキュメントAIを求めるならこれを選ぶべきです。Deepseek OCRのトランスフォーマーベース技術と効率的な処理は、本格的なドキュメントインテリジェンスに最適な選択肢です。
キャッシュヒット時の100万入力トークンあたり
キャッシュミス時の100万入力トークンあたり
100万出力トークンあたり
利用可能な製品がありません