alpの日記: PyCompactUnicodeObject の使い方
日記 by
alp
- これを直接返すにはどうするんだろう。というか、このオブジェクトの内部実装(べき論で)どうなっているんでしょう? 現状の ad hoc な実装は見る気もしないし……
いや、PyUnicode_2BYTE_KIND を指定してサロゲートペアを返したら UnicodeEncode で落ちたので、とりあえずどうするのがいいのかなと。BMP外混在なら全体を PyUnicode_4BYTE_KIND に書き換えて投げるしかないのかな。
#正直 PEP393 の前から文字列周り Python は何も考えていないので辛い。実装を隠蔽する気なら何をどうするのかもう少し文書化してほしい。
PyCompactUnicodeObject の使い方 More ログイン