UnicodeDecodeError: 'utf8' コーデックは位置 0 のバイト 0xa5 をデコードできません。

Question

さらに

質問

UnicodeDecodeError: 'utf8' コーデックは位置 0 のバイト 0xa5 をデコードできません。

私は Python-2.6 CGI スクリプトを使用していますが、json.dumps() を実行中にサーバーログでこのエラーを見つけました、

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(__getdata())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

ここで、

関数 __getdata() は 辞書 {} を返します。

この質問を掲示する前に私は質問のos SOのこれを参照した。

更新情報

以下の行はJSONエンコーダーを傷つけています、

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

一時的に修正しました

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

しかし、それが正しい方法かどうかはわかりません。

Community

編集された質問 23日 5月 2017 в 12:34

プログラミング

python

json

Coral

7日 9月 2017 в 9:39

さらに

以下のコードスニペットを試してください。

with open(path, 'rb') as f:
  text = f.read()

Felipe Augusto

編集した答え 10日 6月 2019 в 4:01

85

0

解決策・回答

MSalty

26日 5月 2018 в 1:15

さらに

read_csv()コマンドで別のコーデックパッケージを定義するだけでこれを切り替えました。

encoding = 'unicode_escape'

Felipe Augusto

編集した答え 10日 6月 2019 в 4:00

64

0

JCF

23日 3月 2015 в 6:19

さらに

文字列には、非ascii文字がエンコードされています。

コードで他のエンコーディングを使用する必要がある場合は、utf-8でデコードできないことがあります。例:

>>> 'my weird character \x96'.decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 19: invalid start byte

この場合、エンコーディングはwindows-1252なので、次のことを行う必要があります。

>>> 'my weird character \x96'.decode('windows-1252')
u'my weird character \u2013'

unicodeを使用したので、安全にutf-8にエンコードできます。

32

0

Krishna prasad.m

28日 3月 2019 в 6:15

さらに

read csvで、エンコーディングメソッドを追加しました。

import pandas as pd
dataset = pd.read_csv('sample_data.csv',header=0,encoding = 'unicode_escape')

Felipe Augusto

編集した答え 10日 6月 2019 в 4:00

25

0

HimalayanCoder

9日 2月 2015 в 12:23

さらに

コードの先頭にデフォルトのエンコーダーを設定する。

import sys
reload(sys)
sys.setdefaultencoding("ISO-8859-1")

15

0

Punnerud

15日 7月 2018 в 7:13

さらに

aaronpenneとSoumyaanshに触発されました。

f    = open("file.txt","rb")
text = f.read().decode(errors='replace')

Punnerud

編集した答え 15日 7月 2018 в 8:01

12

0

aaronpenne

15日 5月 2018 в 10:08

さらに

2018-05の時点で、これは[decodeで直接処理され、少なくともPython 3の場合)(https://docs.python.org/3/library/codecs.html#codecs.decode)。。

「無効な開始バイト」および「無効な継続バイト」タイプのエラーを取得した後、以下のスニペットを使用しています。 errors = 'ignore'を追加すると、修正されました。

with open(out_file, 'rb') as f:
    for line in f:
        print(line.decode(errors='ignore'))

codecs — Codec registry and base classes — Python 3.10.7 documentation

docs.python.org

9

0

Dipak Ingole

19日 3月 2014 в 10:23

さらに

次の行はJSONエンコーダーを傷つけている、

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

一時的に修正しました

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

一時的な修正として、これを正しいものとしてマークする（そうとは限らない）。

6

0

質問の追加

カテゴリ

すべて

技術情報

文化・レクリエーション

生活・芸術

科学

プロフェッショナル

事業内容

ユーザー

すべて

新しい