В Python чтение из файла и сохранение в UTF-8

Question

Дополнительно

Вопрос

В Python чтение из файла и сохранение в UTF-8

Я'м возникли проблемы с чтением из файла, обрабатывать ее строку и сохраняете файл в UTF-8.

Вот код:

try:
    filehandle = open(filename,"r")
except:
    print("Could not open file " + filename)
    quit() 

text = filehandle.read()
filehandle.close()

Потом я делаю какую-то обработку текстовой переменной.

А потом

try:
    writer = open(output,"w")
except:
    print("Could not open file " + output)
    quit() 

#data = text.decode("iso 8859-15")    
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()

Этот вывод прекрасно файл, но он делает это в ISO 8859-15 по моим редактором. Так же редактор распознает входной файл (в переменную именем) как UTF-8 я не'т знаю, почему это произошло. Насколько мои исследования показали закомментированные строки должны решить проблему. Однако, когда я использую эти строки результирующего файла-абракадабра в специальный знак, в основном, слова с Тильдой как текст на испанском языке. Я бы очень признателен за любую помощь, как я в тупик....

Hristo Iliev

Редактировал вопрос 7-го марта 2018 в 1:17

utf-8

Решение / Ответ

27-го июля 2017 в 6:34

Дополнительно

Вы также можете пройти через это с ниже код:

file=open(completefilepath,'r',encoding='utf8',errors="ignore")
file.read()

Noel Widmer

Редактировал ответ 27-го июля 2017 в 8:23

7

0

Fernando Freitas Alves

25-го октября 2013 в 1:52

Дополнительно

Вы можете'т сделать это, используя открытые. используют кодеки.

когда вы открываете файл в Python с использованием открытой встроенной функции вы сможете всегда прочитать/записать файл в ASCII. Писать в UTF-8, Попробуйте это:

import codecs
file = codecs.open('data.txt','w','utf-8')

4

0

Похожие сообщества 30

Python beginners

14 568 пользователей

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Правила группы: https://t.me/ru_python_beginners/2752736

Открыть telegram

Python

13 656 пользователей

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404

Открыть telegram

🐍 Python Stepik Chat

11 621 пользователей

Этот уютный чат создан для помощи в решение задач на прекрасном курсе "Поколение Python: курс для начинающих" и не только. Правила: https://t.me/pythonstepikchat/619142 Чат для оффтопа - t.me/+fqNb78zlQY81NGUy Наш канал - @kimport_this

Открыть telegram

Вакансии для Python-разработчиков / Python Jobs

6 970 пользователей

Как разместить вакансию? — https://t.me/ru_pythonjobs/21926 Размещение вакансий бесплатно. Только Python. Рекламы нет.

Открыть telegram

Python — вакансии и аналитика

6 933 пользователей

Публикуем вакансии и запросы на поиск работы по направлению Python, Flask и т.д. Здесь всё: full-time, part-time, remote и разовые подработки. См. также: @golang_jobs, @qa_jobs, @devops_jobs, @javascript_jobs, @nodejs_jobs, @uiux_jobs, @products_jobs

Открыть telegram

Сообщество Python Программистов

5 722 пользователей

Канал: @pip_install Наши сайты: https://python-scripts.com https://selenium-python.com https://itfy.org Мы в ВК: https://vk.com/open_sourcecode Вакансии: https://t.me/python_scripts_hr

Открыть telegram

Добавить вопрос

Категории

Все

Технологий

Культура / Отдых

Жизнь / Искусство

Наука

Профессии

Бизнес

Пользователи

1

Зарегистрирован 3 недели назад

2

Артур «Апер»

Зарегистрирован 2 месяца назад

3

Viktor Malyutin

Зарегистрирован 2 месяца назад

4

Viktor Malyutin

Зарегистрирован 2 месяца назад

5

Syahputra Zhedenk

Зарегистрирован 2 месяца назад

Хотите что-то узнать? Задавайте Ваш вопрос на нашем сайте

ru.kzen.dev

Mark Tolonen · Accepted Answer · 2013-10-25T13:55:41+00:00

Текст процесса и из Unicode в системе ввода-вывода границы вашей программы с помощью модуля кодеки:

import codecs
with codecs.open(filename, 'r', encoding='utf8') as f:
    text = f.read()
# process Unicode text
with codecs.open(filename, 'w', encoding='utf8') as f:
    f.write(text)

Редактировать: модуль ввода-вывода вместо него рекомендуется использовать кодеки и совместим с Python 3'ы открыть синтаксис:

import io
with io.open(filename, 'r', encoding='utf8') as f:
    text = f.read()
# process Unicode text
with io.open(filename, 'w', encoding='utf8') as f:
    f.write(text)