免責事項:本ページに掲載する情報には、お客様の利便性のために機械翻訳を使用しています。そのため、情報の正確性、相当性、完全性などを保証するものではありません。または、当翻訳の正確性に関わる問題が発生した場合も、オートメーション・エニウェアは一切の責務を負いませんのでご了承ください。オリジナルの英語版も合わせてご確認ください。

PDFのページ数を減らす

PDFファイルからのデータ抽出はOCRエンジンを使用して行われますが、コストはページ数に基づいて計算されます。このユーティリティボットは、データ抽出のページ数を減らします。

主なメリット

  • データ抽出のページ数を減らす
  • 自動化の迅速な実行
  • Bot の AHT を低減

タスク

  • Python ライブラリを使用して PDF ファイルを読み取る
  • クラシファイア用語を使用した PDF ファイルの不備
  • キー値のみを含むページ数が少ないファイルを作成します

PDF ファイルは、フォームやドキュメントで情報を共有する標準的な方法です。OCR エンジンは、これらのドキュメントからのデータ抽出に使用されます。ほとんどのOCRサービスプロバイダーは、スキャンされたページ数に基づいてクライアントに課金します。このユーティリティの Bot の目的は、キーワードに基づいて必要なページのみを選択することにより、ページ数を減らすことです。このユーティリティは、多くのページを扱うクライアントにかなりのコスト削減を提供します。このユーティリティは、Python ライブラリを使用してデータ抽出を完了することで、オートメーションの実行時間に影響しません。\

ページ数は次の方法で実行できます。

  • ドキュメント内のクラシファイア テキストに基づいて、入力の PDF ファイルを分類します。さまざまなカテゴリのページをグループ化すると、キーワード検索機能のパフォーマンスが強化されます。
  • PDFファイルで特定のキーワード検索を分類します。すべてのページですべてのキーワードを検索すると比較して、クイック 検索操作を完了します。会社名、フォーム名など、最初の数ページに表示される単語を分類することを検討してください。
Bot を入手

無料

Botセキュリティ プログラム
レベル 1
アプリケーション
業務プロセス
カテゴリ
ダウンロード回数
17
ベンダー
オートメーションのタイプ
Bot
最終更新日
2020 年 12 月 11 日
初公開日
2020 年 6 月 5 日
Enterprise のバージョン
11.3
Community のバージョン
11.3.1
ReadMe
ReadMe
サポート

Bot が動作する様子

プロセス フロー
構成ファイル
スクリプト
前へ 次へ
プロセス フロー
構成ファイル
スクリプト

セットアップ工程

インストール

Bot をダウンロードし、指示に従って AAE Control Room にインストールします。

構成

Bot を開いて、Bot に必要なユーザー名とその他の設定を構成します (詳細については、インストール ガイドまたは ReadMe を参照)。

実行

これで Bot の準備は完了です。すぐに実行してみましょう。

要件と入力内容

  • 構成ファイル
  • PDF ファイルを入力
  • Readme ファイルに記載されている必須ライブラリを持つ Python