メインコンテンツまでスキップ

Conversions API

概要: 文書ファイルをテキストに変換するAPIです。非同期処理でレイアウト情報やメタデータと共に構造化されたテキストデータを取得できます。

POST /v1/api/conversions

アップロードファイルを非同期でテキストに変換します。

処理はジョブとして非同期に実行されます。 ページ数を指定した場合はfrom_page〜to_pageを対象に変換を実施します。

ジョブ結果を確認するための変換ID(conversion_id)を返します。

tips

スペースIDはスペース作成のタイミング以外でも、URLから確認できます。

URLから、スペースID確認できます
URLから、スペースID確認できます
POST /v1/api/conversions

Headers

  • api-key : string(required) - rokadoc APIキー

Request Example

curl -X 'POST' \
'https://beta-api.rokadoc.ntt.com/v1/api/conversions' \
-H "api-key: ${ROKADOC_API_KEY}" \
-F 'upload_file=@sample.pdf' \
-F "space_id=${SPACE_ID}" \
-F 'from_page=1' \
-F 'to_page=1' \
-F 'vllm_name=vllm_router_openai' \
-F 'vllm_prompt=詳細に説明してください' \
-F 'layout_algo_names=miner_layout_text_line' \
-F 'layout_algo_names=com_layout_only' \
-F 'layout_algo_names=com_layout_text_line' \
-F 'image_tag=false'

Request Body (multipart/form-data)

必須パラメータ
  • upload_file : file(required) - 対象のファイルを指定します
    • 対応フォーマット: .pdf .docx .doc .ppt .pptx .xlsx .xls
オプショナルパラメータ
  • space_id : string(optional) - スペース機能を利用する場合はスペースIDを指定
  • from_page : integer(optional) - 開始ページ数
  • to_page : integer(optional) - 終了ページ数
  • vllm_prompt : string(optional) - ドキュメント上の画像をテキスト化する際のカスタムプロンプト。指定しない場合デフォルトプロンプトが利用されます
  • vllm_name : string(optional) - vllmで利用するAI名 (デフォルト: vllm_router_openai)
  • layout_algo_names : array(optional) - どのレイアウト解析ツールを使用するかを指定(複数指定も可)
    • デフォルトの構成: ["com_layout_only", "com_layout_text_line", "miner_layout_text_line"]
    • 手書きを含む場合の構成: ["cloud_layout_all", "com_layout_only", "miner_layout_text_line"]
  • image_tag : boolean(optional) - イメージをタグとして出力する場合はTrueを指定 (デフォルト: false)

Response

202 Accepted - ジョブ受付完了
{
"code": 202,
"status": "Pending",
"conversion_id": "xxxx"
}
  • code : integer - ステータスコード
  • status : string - ジョブのステータス
  • conversion_id : string - 変換ID。ジョブ結果を確認するために使用
422 Validation Error
{
"detail": [
{
"type": "enum",
"loc": [
"body",
"layout_algo_names",
0
],
"msg": "Input should be 'cloud_layout_all', 'miner_layout_text_line', 'com_layout_only' or 'com_layout_text_line'",
"input": "[\"miner_layout_text_line,com_layout_only,com_layout_text_line\"]",
"ctx": {
"expected": "'cloud_layout_all', 'miner_layout_text_line', 'com_layout_only' or 'com_layout_text_line'"
}
}
]
}

注意事項

  • ファイルサイズや処理時間に制限があります
  • 非同期処理のため、結果はステータス確認APIで取得してください
  • 変換IDを使用してジョブの進行状況を確認できます