UiPath データスクレイピング(構造化データを抽出 アクティビティ)

「構造化データを抽出」はUiPathでWebサイトの表(TABLEタグ)から

データテーブルを取得するアクティビティです。

この記事ではその使い方を紹介します。

アクティビティの使い方

まず「ブラウザーを開く」を設置しデータを取得するURLを指定します。

多くのアクティビティでは同様に「構造化データを抽出」をドロップしますが、

このアクティビティでは他の手順を方が効率が良いです。(後述)

サンプルとして今回はYahooの日経平均株価の履歴を取得します。

まず「ブラウザーを開く」のURL欄にYahooの日経平均株価の履歴を指定します。

実用上は情報が必要な期間を検索して、そのURLを指定することになるでしょう。

「ブラウザーを開く」のURL欄にYahooの日経平均株価の履歴を指定

そして利用するブラウザでURLを開いておきます。

次にメニューより「データスクレイピング」をクリックします。

メニューより「データスクレイピング」をクリック

「取得ウィザード」が表示されるので「次へ」をクリックします。

「取得ウィザード」が表示されるので「次へ」をクリック

データを取得する表の最も左上(今回のサンプルでは日付セル)をクリックします。

表の最も左上(今回のサンプルでは日付セル)をクリック

「表形式データを抽出」が表示されるので「はい」をクリックします。

「取得ウィザード」が表示されるので「結果件数の最大」を0にして終了をクリックします。

「取得ウィザード」が表示されるので「結果件数の最大」を0にして終了をクリック

「次へのリンクを指定」が表示されます。

表が1ページで終了する場合は「いいえ」、

別ページにまたがる場合は「はい」をクリックします。

今回は複数ページにまたがるので「はい」をクリックします。

ページを切り替える場所(サンプルでは「次へ」ボタン)をクリックします。

「データスクレイピング」が追加されるので

「構造化データを抽出」を「ブラウザーの開く」のDoへ移動します。

そして「データスクレイピング」は不要なので削除します。

「データスクレイピング」が追加されるので「構造化データを抽出」を「ブラウザーの開く」のDoへ移動し「データスクレイピング」は不要なので削除

DataTable型変数を用意し、出力のデータテーブルに指定します。

これによりWebブラウザから取得したデータがこの変数に格納される状態になります。

DataTable型変数を用意し、出力のデータテーブルに指定

この変数を「CSVに書き込み」や「Excel 範囲に書き込み」に利用すれば

自動的に全ページ分の日経平均株価をCSVやExcelに書き込むことが可能です。

以上がデータスクレイピング(構造化データを抽出 アクティビティ)の基本的な使い方です。

プロパティ

共通

共通プロパティ
項目名説明
表示名デザイナーパネル上の表示名を設定します。
エラー発生時に実行を継続アクティビティでエラーが発生した場合の挙動を設定します。
Trueにすると処理を継続します。(例外が発生しない)
Falseにすると処理を停止します。(例外発生)
空白の場合Falseの挙動になります。
発生した例外を受け取ってエラー処理を行う場合は
トライ キャッチの中にアクティビティを設置します。

入力

入力プロパティ

Webページの中のどこからデータを取得するかを指定します。

データスクレイピングで自動的に設定されるので

基本的には操作する必要がありません。(手動設定はハードルが高いです)

ただタイムアウト(ミリ秒)は初期状態では30000 ミリ秒 (30 秒)で

それでうまく動作しない場合は大きい値に変更しましょう。

出力

データの取得結果を格納するDataTable型変数を指定します。

オプション

オプションプロパティ

取得データが複数ページに分かれている場合の指定をします。

データスクレイピングで自動的に設定されるので

基本的には操作する必要がありません。(手動設定はハードルが高いです)

ページ間の待機時間(ミリ秒)は初期状態では30000 ミリ秒 (30 秒)で

それでうまく動作しない場合は大きい値に変更しましょう。

その他

UiPathのログに引数や変数の値が表示されるかを指定します。

機密性の高い情報を取り扱う場合にのみチェックする必要があります。

プライベートのキャプチャ

関連記事