Conversions API
概要: 文書ファイルをテキストに変換するAPIです。非同期処理でレイアウト情報やメタデータと共に構造化されたテキストデータを取得できます。
POST /v1/api/conversions
アップロードファイルを非同期でテキストに変換します。
処理はジョブとして非同期に実行されます。 ページ数を指定した場合はfrom_page〜to_pageを対象に変換を実施します。
ジョブ結果を確認するための変換ID(conversion_id)を返します。
tips
スペースIDはスペース作成のタイミング以外で も、URLから確認できます。

POST /v1/api/conversions
Headers
api-key
: string(required) - rokadoc APIキー
Request Example
- Python
- curl
import requests
import os
api_key = os.getenv("ROKADOC_API_KEY")
space_id = os.getenv("SPACE_ID")
url = "https://beta-api.rokadoc.ntt.com/v1/api/conversions"
headers = {
"api-key": api_key
}
files = {
"upload_file": open("sample.pdf", "rb")
}
data = {
"space_id": space_id,
"from_page": 1,
"to_page": 1,
"vllm_name": "vllm_router_openai",
"layout_algo_names": ["com_layout_text_line", "com_layout_only", "miner_layout_text_line"],
"image_tag": False
}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
curl -X 'POST' \
'https://beta-api.rokadoc.ntt.com/v1/api/conversions' \
-H "api-key: ${ROKADOC_API_KEY}" \
-F 'upload_file=@sample.pdf' \
-F "space_id=${SPACE_ID}" \
-F 'from_page=1' \
-F 'to_page=1' \
-F 'vllm_name=vllm_router_openai' \
-F 'vllm_prompt=詳細に説明してください' \
-F 'layout_algo_names=miner_layout_text_line' \
-F 'layout_algo_names=com_layout_only' \
-F 'layout_algo_names=com_layout_text_line' \
-F 'image_tag=false'
Request Body (multipart/form-data)
必須パラメータ
upload_file
: file(required) - 対象のファイルを指定します- 対応フォーマット: .pdf .docx .doc .ppt .pptx .xlsx .xls
オプショナルパラメータ
space_id
: string(optional) - スペース機能を利用する場合はスペースIDを指定from_page
: integer(optional) - 開始ページ数to_page
: integer(optional) - 終了ページ数vllm_prompt
: string(optional) - ドキュメント上の画像をテキスト化する際のカスタムプロンプト。指定しない場合デフォルトプロンプトが利用されますvllm_name
: string(optional) - vllmで利用するAI名 (デフォルト: vllm_router_openai)layout_algo_names
: array(optional) - どのレイアウト解析ツールを使用するかを指定(複数指定も可)- デフォルトの構成: ["com_layout_only", "com_layout_text_line", "miner_layout_text_line"]
- 手書きを含む場合の構成: ["cloud_layout_all", "com_layout_only", "miner_layout_text_line"]
image_tag
: boolean(optional) - イメージをタグとして出力する場合はTrueを指定 (デフォルト: false)