ボンジュール・マドモアゼル

本サイトの情報は自己責任にてご利用下さい。

[その他] URLDownloadToFile で汎用サイトダウンロードツールを作れない理由

 
  1. 圧縮され転送されたファイル(Content-Encoding: gzip)に対応できそうもない。
    URLDownloadToFile のみでは、それが、Content-Encoding: gzipかどうかの判定ができそうもない。
    また、ダウンロードしたHTMLファイルにおいて、ローカル・ファイルを正しくリンクするようリンク先を変換する必要があるが、gzipのままでテキスト変換すると、文字化けしてしまう。
  2. JavaScript などで動的にリンク先を編集している場合、そのリンク先を辿れない。
    URLDownloadToFile のみでサイトダウンロードを実装する場合、HTMLファイルにどのようなリンク先があるかは自前でテキスト解析することになるが、動的に編集されるリンク先が解析ができない。

対処がないとは言い切れないが、素直に WebBrowserControl を使うべきか。
<<URLDownloadToFile 成功なのにダウンロードできない | ホーム | PHP 5.3 goto 追加>>

コメント

コメントの投稿

管理者にだけ表示を許可する

画像の文字を半角数字で下記ボックスに記入ください。
文字が読みにくい場合はブラウザの更新をすると新しい文字列が表示されます。