打开他们网站看了head标签 是UTF8啊 charset=utf-8″>复制代码
如果直接存二进制用自己本地编辑器以UTF8解码也是不乱码的。为什么存字符串就会报编码错误呢
江西省网友说:你这代码一看就是高手啊,你整不明白,估计能帮你整明白的人不多。
江西省网友说:你这代码一看就是高手啊,你整不明白,估计能帮你整明白的人不多。
青海省网友说:直接输出byte数据,判断编码
曾经碰见某网站,首页是utf8,二级页就成了某种日文编码,三级页面是某种ISO编码,就是有这种奇葩的网站
台湾省网友说:直接存二进制open用”wb”参数, 然后 f.write(r.content),
要么,r.content.decode(“utf-8″,”ignore”) 把非法字符干掉。