パスワードを忘れた? アカウント作成
449999 journal

mumumuの日記: Parsing of undecoded UTF-8 will give garbage : Protocol.pm

日記 by mumumu

http://www.mail-archive.com/libwww@perl.org/msg06095.html

HTML::HeadParserにより、LWP::UserAgentは、HTML内
のhead内をも HTTP Headerとして解釈する。だが、UTF-8
のコンテンツを含んだURIを解釈させると、以下のような
警告が生成されることがある。

Parsing of undecoded UTF-8 will give garbage
  when decoding entities at
/usr/lib/perl5/site_perl/5.8.0/LWP/Protocol.pm line 114

これは上記URIの通りバグとされている。基本的には無視
しても良いのだが、気持ち悪いことには変わりない。

workaround としては、

$ua->parse_head(0);

として、HTMLのhead内の解釈を行わないように指示する
ことが挙げられるが、head内の解釈を行わせたい私のよう
な場合には、もうどうしようもないと言えよう(´ー`;)

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

ソースを見ろ -- ある4桁UID

読み込み中...