UnicodeDecodeError: 'utf8' codec dapat't decode byte 0xa5 di posisi 0: tidak valid mulai byte

Question

Lebih

Question

UnicodeDecodeError: 'utf8' codec dapat't decode byte 0xa5 di posisi 0: tidak valid mulai byte

Saya menggunakan Python-2.6 CGI script ini error di log server saat melakukan json.kesedihan(),

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(__getdata())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

Di sini ,

__getdata() kembali fungsi kamus {} .

Sebelum posting pertanyaan ini saya telah dirujuk ini pertanyaan os JADI.

UPDATE

Baris berikut adalah menyakiti JSON encoder,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Aku memperbaiki sementara untuk itu

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Tapi saya tidak yakin apakah itu cara yang benar untuk melakukannya.

Community

Pertanyaan edit 23 Mei 2017 в 12:34

Pemrograman

python

json

Coral

7 September 2017 в 9:39

Lebih

Coba kode di bawah ini cuplikan:

with open(path, 'rb') as f:
  text = f.read()

Felipe Augusto

Jawaban edit 10 Juni 2019 в 4:01

85

0

Solution / Answer

MSalty

26 Mei 2018 в 1:15

Lebih

Saya beralih ini hanya dengan mendefinisikan berbagai paket codec di read_csv() perintah:

encoding = 'unicode_escape'

Felipe Augusto

Jawaban edit 10 Juni 2019 в 4:00

64

0

JCF

23 Maret 2015 в 6:19

Lebih

String anda memiliki non-ascii karakter dikodekan di dalamnya.

Tidak mampu untuk men-decode dengan utf-8 mungkin terjadi jika anda've diperlukan untuk menggunakan pengkodean lainnya dalam kode anda. Misalnya:

>>> 'my weird character \x96'.decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 19: invalid start byte

Dalam hal ini, encoding adalah windows-1252 jadi yang harus anda lakukan:

>>> 'my weird character \x96'.decode('windows-1252')
u'my weird character \u2013'

Sekarang bahwa anda memiliki unicode, anda dapat dengan aman encode ke utf-8.

32

0

Krishna prasad.m

28 Maret 2019 в 6:15

Lebih

Baca csv saya menambahkan sebuah metode pengkodean:

import pandas as pd
dataset = pd.read_csv('sample_data.csv',header=0,encoding = 'unicode_escape')

Felipe Augusto

Jawaban edit 10 Juni 2019 в 4:00

25

0

HimalayanCoder

9 Februari 2015 в 12:23

Lebih

Set default encoder di atas kode

import sys
reload(sys)
sys.setdefaultencoding("ISO-8859-1")

15

0

Punnerud

15 Juli 2018 в 7:13

Lebih

Terinspirasi oleh aaronpenne dan Soumyaansh

f    = open("file.txt","rb")
text = f.read().decode(errors='replace')

Punnerud

Jawaban edit 15 Juli 2018 в 8:01

12

0

aaronpenne

15 Mei 2018 в 10:08

Lebih

Sebagai 2018-05 ini ditangani langsung dengan decode, setidaknya untuk Python 3.

I'm menggunakan berikut cuplikan setelah mendapatkan tidak valid mulai byte dan tidak valid kelanjutan byte jenis kesalahan. Menambahkan kesalahan='mengabaikan' tetap untuk saya.

with open(out_file, 'rb') as f:
    for line in f:
        print(line.decode(errors='ignore'))

codecs — Codec registry and base classes — Python 3.10.7 documentation

docs.python.org

9

0

Dipak Ingole

19 Maret 2014 в 10:23

Lebih

Baris berikut adalah menyakiti JSON encoder,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Aku memperbaiki sementara untuk itu

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Menandai ini sebagai benar sebagai temporary fix (Tidak yakin).

6

0

Related communities 6

Python Indonesia

25 972 pengguna

Programmer Python Indonesia. Group ini dikelola oleh sejumlah admin. Baca pesan tersemat / pinned message: https://t.me/pythonID/217588

Buka telegram

Indonesian Python Warriors

1 564 pengguna

Di grup ini tidak ada kewajiban untuk menggunakan username dan foto. Yang tidak boleh adalah spamming. Gak boleh baper, kalau nanya yang bener, eror jangan difoto pake HP, gunakan screenshot, code copas ke dpaste.org lalu share link ke sini.

Buka telegram

Python-ID Jogja

947 pengguna

Buka telegram

Python Newbie Indonesia

471 pengguna

Peraturan grup Python Newbie 🌻Dilarang spam 🌻Dilarang menggunakan bahasa kasar 🌻Dilarang beriklan di grup tanpa seizin admin Beberapa video dasar python dapat diliat melalui channel youtube juan aditya Jangan lupa untuk subscribe ya🙏

Buka telegram

BASIC PYTHON INDONESIA

351 pengguna

Buka telegram

PythonWealth Indonesia 🇮🇩

14 pengguna

Buka telegram

Tambahkan pertanyaan

Kategori

Semua

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Semua

Baru

Populer

1

Ксения Комарова

Terdaftar 2 minggu yang lalu

2

Артур «Апер»

Terdaftar 1 bulan yang lalu

3

Viktor Malyutin

Terdaftar 2 bulan yang lalu

4

Viktor Malyutin

Terdaftar 2 bulan yang lalu

5

Syahputra Zhedenk

Terdaftar 2 bulan yang lalu

Anda punya pertanyaan? Tambahkan di situs dan dapatkan jawabannya secara instan

id.kzen.dev

Santosh Ghimire · Accepted Answer · 2014-03-06T06:28:53+00:00

Kesalahan ini karena ada beberapa karakter non-ascii di kamus dan dapat't akan dikodekan/diterjemahkan. Salah satu cara sederhana untuk menghindari kesalahan ini adalah untuk mengkodekan string tersebut dengan encode() fungsi sebagai berikut (jika a adalah string dengan karakter non-ascii):

a.encode('utf-8').strip()