日本語の混じったcsvファイルをデータフレームに読み込もうとすると
以下のようなエラーが出るdd
‘utf-8’ codec can’t decode byte 0x83 in position 0: invalid start byte
そのような時は以下のような方法で読み込めば
問題なく処理される
1 2 3 4 |
import codecs # df = pd.read_csv("data/201902251104359122801.csv") with codecs.open("data/201902251104359122801.csv", "r", "Shift-JIS", "ignore") as file: df = pd.read_table(file, delimiter=",") |