当先锋百科网

首页 1 2 3 4 5 6 7

36爬取豆瓣评论编码报错?

从您描述的问题来看,应该是编码的问题

引起的原因有可能是在字符串中带有特殊的字符,类似微信的表情符号

可以尝试使用如下方式解决,通过转换表将BMP外部的所有内容映射到替换字符:

import sys

non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0xfffd)

print(x.translate(non_bmp_map))