免責事項:本ページに掲載する情報には、お客様の利便性のために機械翻訳を使用しています。そのため、情報の正確性、相当性、完全性などを保証するものではありません。または、当翻訳の正確性に関わる問題が発生した場合も、オートメーション・エニウェアは一切の責務を負いませんのでご了承ください。オリジナルの英語版も合わせてご確認ください。
PDFのページ数を減らす
PDFファイルからのデータ抽出はOCRエンジンを使用して行われますが、コストはページ数に基づいて計算されます。このユーティリティボットは、データ抽出のページ数を減らします。
主なメリット
- データ抽出のページ数を減らす
- 自動化の迅速な実行
- Bot の AHT を低減


タスク
- Python ライブラリを使用して PDF ファイルを読み取る
- クラシファイア用語を使用した PDF ファイルの不備
- キー値のみを含むページ数が少ないファイルを作成します
PDF ファイルは、フォームやドキュメントで情報を共有する標準的な方法です。OCR エンジンは、これらのドキュメントからのデータ抽出に使用されます。ほとんどのOCRサービスプロバイダーは、スキャンされたページ数に基づいてクライアントに課金します。このユーティリティの Bot の目的は、キーワードに基づいて必要なページのみを選択することにより、ページ数を減らすことです。このユーティリティは、多くのページを扱うクライアントにかなりのコスト削減を提供します。このユーティリティは、Python ライブラリを使用してデータ抽出を完了することで、オートメーションの実行時間に影響しません。\
ページ数は次の方法で実行できます。
- ドキュメント内のクラシファイア テキストに基づいて、入力の PDF ファイルを分類します。さまざまなカテゴリのページをグループ化すると、キーワード検索機能のパフォーマンスが強化されます。
- PDFファイルで特定のキーワード検索を分類します。すべてのページですべてのキーワードを検索すると比較して、クイック 検索操作を完了します。会社名、フォーム名など、最初の数ページに表示される単語を分類することを検討してください。
無料
- オートメーションのタイプ
- Bot
- 最終更新日
- 2020 年 12 月 11 日
- 初公開日
- 2020 年 6 月 5 日
- Enterprise のバージョン
- 11.3
- Community のバージョン
- 11.3.1
- ReadMe
- ReadMe
- サポート
-
- コミュニティのサポートのみ
- A-People コミュニティのフォーラム
- Bot Store に関するよくある質問 (FAQ)
Bot が動作する様子
セットアップ工程
インストール
Bot をダウンロードし、指示に従って AAE Control Room にインストールします。
構成
Bot を開いて、Bot に必要なユーザー名とその他の設定を構成します (詳細については、インストール ガイドまたは ReadMe を参照)。
実行
これで Bot の準備は完了です。すぐに実行してみましょう。
要件と入力内容
- 構成ファイル
- PDF ファイルを入力
- Readme ファイルに記載されている必須ライブラリを持つ Python