こんにちは。
最近VTuberアイドルであるHololiveが身近で流行っているのですが、メンバーが多く覚えきれないので画像分類器を作成しようと考えています。
そこで、教師データとなる大量の画像データが必要になるので、GoogleChromeとそのプラグインであるImgaDownloaderを使用したGoogle画像検索のサムネイルを一括でダウンロードする方法を書こうと思います。
使用するのはこちらの拡張機能「ImageDownloader」です。
今回は宝鐘マリンの画像を集めようと思います。
まず、下準備としてGoogleChromeのダウンロード保存先を確認されないように設定変更します。
これを設定しておかないと数百回保存ボタンを押す羽目になります。
次に画像検索で対象のページを開きます。
そしたら一度すべての検索結果を表示させるために一番下までスクロールしてすべての画像をブラウザに読み込ませます。
一番下まで行くと「未読はありません」との表示が出ます。
この状態で拡張機能であるImgaeDownloaderを起動します。
すると表示されているすべての画像がリストアップされています。今回は559件です。
しかし、この中には検索結果以外の画像も含まれています。
例えばGoogleのロゴだったり、自分のアイコンだったり。
そこで検索結果だけフィルタリングするために一番上のフィルターURLに以下のアドレスを入力します。
encrypted-tbn0.gstatic.com
すると検索結果の画像のサムネイルのみ表示されます。今回は515件ですね。
あとはSelectAllのチェックを入れて、ダウンロードフォルダ名と画像のファイル名を指定してあげます。
あとはダウンロードするだけです。
ブラウザで指定しているダウンロードフォルダに新しいフォルダと連番で名前付けされた画像ファイルが問題なく保存されています。
ちょっと調べた限りでは画像分類器には高解像度の画像をあまり使用していないことが多い様なので解像度としては十分かなと思います。
あとはデータ数が少ないので、どうデータ強化していくかがキーだとは思うのですが、ぼちぼちやっていこうと思います。