Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/15: Рейтинг темы: голосов - 15, средняя оценка - 4.93
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,698

Как правильно вывести файл в кодировке UTF-16LE?

29.03.2017, 19:21. Показов 3632. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Друзья! НА самом-то деле я всё правильно делаю. Вот код:

Python
1
2
3
4
import codecs
f = codecs.open ("foo.txt", 'r', "UTF-16LE")
for line in f:
    print(line)
Вот вывод:

Windows Batch file
1
2
3
4
5
6
7
 Раздел
 
Название
 
Последнее
 
Process finished with exit code 0
Видите пробел перед словом "Раздел"? Вот вообще не разговор! Это пробел мне очень мешает при обработке строк файла! Тем более, что этого пробела в оригинале просто напросто нет и файл foo.txt очень даже корректный и правильный файл. Вот его начало: (смотрено в hiew)
FF FE 20 04
То есть видим, что сперва идёт BOM, потом символ 0X420 (русское "Р") и так далее, никакого пробела впереди нет. В общем, как мне правильно без пробела (которого нет в оригинале) вывести этот файл? Понятное дело, что костыль не мастырить. (То есть, например, считываем построчно и потом из первой строки убираем первый символ.) Это не дело. Ведь откуда взялся этот пробел и как сделать, чтобы его никогда не было в подобном коде, я так и не пойму. Спасибо, кто откликнется.

Не раз уже просил навести порядок с пробелами, так и не наведут. В выводе в первой строке перед "Раздел", должен быть пробел, не знаю, как у вас, у меня видны кракозябры (в браузере я имею ввиду)
Вложения
Тип файла: txt foo.txt (56 байт, 5 просмотров)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.03.2017, 19:21
Ответы с готовыми решениями:

getBytes('UTF-16') даёт UTF-16LE или UTF-16BE?
Добрый день! Делаю J2ME-клиента к некому серверу, исходников которого у меня нет, но есть работающий клиент на C#. Выяснилось, что C#...

Как правильно определить длину строки в кодировке UTF-8?
подскажите как в этот код добавить utf-8 ? потому что русские символы тяжелее в 2 раза. if(strlen($_POST) >= 4 &&...

Как записать файл в кодировке utf-8?
Вообщет задача такая, нужно файл записать в кодировке utf-8 или unicode и нужно чтобы русские символы считывались. Я хочу добиться чтобы...

5
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 19:58
Цитата Сообщение от kravam Посмотреть сообщение
НА самом-то деле я всё правильно делаю
На самом деле нет.
Ваш пробел - это и есть BOM.
Чтобы читать файлы в UTF-16 не нужно указывать порядок байтов. Тогда python будет определять наличие в файле маркера BOM (вот тут он сам с порядком байтов и разберется) и пропускать его при выводе. И об этом четко написано у Лутца.
0
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,698
29.03.2017, 20:04  [ТС]
Garry Galler, ну вот он мне и разобрался. Вывод без указания порядка байт:
Миниатюры
Как правильно вывести файл в кодировке UTF-16LE?  
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 20:08
1
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,698
29.03.2017, 20:16  [ТС]
Garry Galler, вы не ту функцию вызвали. Я вызываю codec.open, а вы просто open

P.S Написал так:

Python
1
f = codecs.open ("foo.txt", 'r', "utf16")
Вроде получается пока. Посмотрим, что будет дальше.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 20:18
Между open и codecs.open в 3.5 нет никакой разницы.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.03.2017, 20:18
Помогаю со студенческими работами здесь

Как создать файл в кодировке UTF-8?
Здравствуйте, вот так вот создаётся текстовый файлик: Dim gg, gm Set gg = CreateObject("Scripting.FileSystemObject") Set gm =...

Как записать в файл строку в кодировке UTF-8?
Здравствуйте уважаемые пользователи, модераторы и все обитатели этого форума! Нужна снова ваша помощь! Ниже представлен скрипт который...

Как можно прочитать файл текстовый в кодировке UTF-8?
Как можно прочитать файл текстовый в кодировке UTF-8?(при чтении c помощью FileSystemObject вместо русских букв другие символы)

Как вывести на экран содержимое файла в кодировке UTF-8?
Как вывести русский текст в кодировке UTF-8 из файла?

Осуществить перекодирование текста в 'UTF-16LE'
Дана текстовая строка с произвольным текстом. Осуществить перекодирование текста в 'UTF-16LE' Примеры: Ввод: Участие в Олимпиаде ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru