我想把印地语句子插入mysql数据库。但我遇到了一个问题:插入mysql数据库的印地语句子变得乱七八糟。我已经将编码格式设置为utf-8,然后我的代码如下。谢谢!
# coding = utf-8
import MySQLdb
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
dbs = MySQLdb.connect(host='x.x.x.x', user='x', passwd = 'x', db='x',port=x)
cursor = dbs.cursor()
with open('hindi.wiki.set','r') as file:
count = 1
for line in file.readlines():
if count == 5:
break
sql = """insert into `lab_ime_test_set_2` (id_, type_, lang_, text_, anno_) values(%s, %s, %s,'%s', %s)""" % ("null", "'wiki'", "'hindi'", MySQLdb.escape_string(line.strip()), "'not_anno'")
try:
cursor.execute(sql)
dbs.commit()
except Exception as eh:
print("error")
print("total count", count)
cursor.close()
dbs.close()
由于sql可以在navicat for mysql中运行,因此可以正确显示印地语。但是当我运行这段代码时,这些句子也可以插入mysql数据库,但是不能正确显示。比如说“संतरे के जायके वाले मूल à¤ÿैंग को 1957में जनरल फूडà¥à¤¸ कॉरपोरेशन के लिठविलियम à¤"
暂无答案!
目前还没有任何答案,快来回答吧!