UnicodeDecodeError: 'utf-8' codec can't decodificar byte

Question

Mais

Question

UnicodeDecodeError: 'utf-8' codec can't decodificar byte

Aqui está o meu código,

for line in open('u.item'):
#read each line

sempre que eu executar este código, ele dá o seguinte erro:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte

Eu tentei resolver isso e adicionar um parâmetro extra em open(), o código é parecido;

for line in open('u.item', encoding='utf-8'):
#read each line

Mas mais uma vez dá o mesmo erro. O que devo fazer então! Por favor, ajude-me.

Solution / Answer

14º setembro 2016 в 7:24

Mais

Se alguém procurar por estes, este é um exemplo para converter um ficheiro CSV em Python 3:

try:
    inputReader = csv.reader(open(argv[1], encoding='ISO-8859-1'), delimiter=',',quotechar='"')
except IOError:
    pass

user812786

Resposta editada :em

2

0

Comunidades relacionadas 3

Pt-BR Data Science & Python

5 045 utilizadores

Abrir telegram

Python Coding Brazil

308 utilizadores

Programação Python. Python Programming. ***************************** ➸ Pentest Brazil Group (pt_BR) http://t.me/pentestbrazilgroup ➸ Pentest Brazil Channel (pt_BR) http://t.me/pentestbrazilchannel

Abrir telegram

Python Brasil

198 utilizadores

Bem vindos a comunidade do python Brasil! oficial do Telegram! 13/05/20

Abrir telegram

Adicionar pergunta

Categorias

Todos

Tecnologia

Cultura / Recreação

Vida / Artes

Ciência

Profissional

Negócios

Utilizadores

Todos

Novo

Popular

1

Ксения Комарова

Registrado há 2 semanas

2

Артур «Апер»

Registrado há 1 mês

3

Viktor Malyutin

Registrado há 2 meses

4

Viktor Malyutin

Registrado há 2 meses

5

Syahputra Zhedenk

Registrado há 2 meses

Tem uma pergunta? Adicione-a no sítio e obtenha uma resposta instantânea

pt.kzen.dev

SujitS · Accepted Answer · 2013-10-31T12:35:45+00:00

Como sugerido por Mark Ransom, encontrei a codificação certa para esse problema. A codificação foi "ISO-8859-1" portanto substituir open("u.item", encoding="utf-8") por open('u.item', encoding = "ISO-8859-1") resolverá o problema.