С Новым годом! Форум программистов, компьютерный форум, киберфорум
Delphi для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.53/30: Рейтинг темы: голосов - 30, средняя оценка - 4.53
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
1

Utf-8 и Cp866

02.09.2013, 17:32. Показов 5701. Ответов 14
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый день.
Возникла проблемка с кодировкой, использую функцию

Delphi
1
2
3
4
5
6
7
8
9
10
11
function StrOemToAnsi(const S: Utf8String): AnsiString;
begin
  if Length(S) = 0 then Result := ''
  else
    begin
      SetLength(Result, Length(S));
 
      OemToAnsiBuff(@S[1], @Result[1], Length(S));
 
    end;
end;
Проблема в том, что качаю запросом zip архив и в нем проблема с кириллицей. На уровне php проблему решить не удалось.
Так вот.
Начальное имя файла: расрас
Имя файла в архиве: TА¦-TБTА¦-TБ
Имя файла, если использовать function StrOemToAnsi: TА¦-TБTА¦-TБ
Но проблема в том, что я не могу сделать обратную функцию, что только не пытался, что б она переводила с
TА¦-TБTА¦-TБ
на
расрас.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
02.09.2013, 17:32
Ответы с готовыми решениями:

Из Cp866 в UTF-8 и обратно
Из Win 7 cmd читаю строку в CP866. Затем, мне нужно ее перекодировать в UTF-8 сделать какие нить...

Из UTF-8 коды символов CP866
Подскажите плиз. Есть строка в UTF-8, из нее необходимо получить char состоящий из кодов этих...

Получить строку в utf-8 в cp866
Подскажите, пожалуйста, каким образом получить преобразование строки в нужную кодировку.

Перевод из кодировки UTF-8 в CP866
Нужно сделать функцию, которая переводит текст из кодировки UTF-8 в CP866. То есть с нуля, так-как...

14
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
02.09.2013, 19:02 2
Непонятно почему вы решили, что OemToAnsiBuff преобразует из UTF8. Для этого есть UTF8Decode/Utf8ToAnsi.
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
02.09.2013, 19:29  [ТС] 3
На скрине через онлайн декодер я сделал проверку.
И да, если б вы внимательно посмотрели код, то входящая строка Utf8String, а не AnsiString.
Миниатюры
Utf-8 и Cp866  
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
03.09.2013, 11:40 4
Цитата Сообщение от Chipito Посмотреть сообщение
И да, если б вы внимательно посмотрели код, то входящая строка Utf8String, а не AnsiString.
Именно поэтому я еще раз говорю: OemToAnsiBuff вообще не работает с UTF8. Ни на входе, ни на выходе. К тому же deprecated.

Ваш "расрас" в архиве лежит в виде UTF8String, и для перевода его в AnsiString нужно вызвать Utf8ToAnsi.
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
03.09.2013, 16:56  [ТС] 5
Delphi
1
2
3
4
5
    begin
     astr:='TА¦-TБTА¦-TБ';
     Utf8ToAnsi(astr);
      memo1.Lines.Add(astr);
end;
Результат TА¦-TБTА¦-TБ
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
03.09.2013, 17:07 6
Цитата Сообщение от Chipito Посмотреть сообщение
Delphi
1
2
3
4
5
    begin
     astr:='TА¦-TБTА¦-TБ';
     Utf8ToAnsi(astr);
      memo1.Lines.Add(astr);
end;
Результат TА¦-TБTА¦-TБ
Конечно, 'TА¦-TБTА¦-TБ' -- это искаженная, насильно приведенная к сугубо печатной форме строка двоичных данных, коей UTF8 с русским текстом и является. Посмотрите на свой скриншот и сравните изображенные на нем символы с этими. Там ничего общего нет.

Добавлено через 5 минут
Delphi
1
2
3
4
5
6
var
  s: UTF8String;
begin
  s:= #209#128#208#176#209#129#209#128#208#176#209#129;
  Memo1.Lines.Add(s);
  Memo1.Lines.Add(Utf8ToAnsi(s));
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
03.09.2013, 17:32  [ТС] 7
Цитата Сообщение от quwy Посмотреть сообщение
Конечно, 'TА¦-TБTА¦-TБ' -- это искаженная, насильно приведенная к сугубо печатной форме строка двоичных данных, коей UTF8 с русским текстом и является. Посмотрите на свой скриншот и сравните изображенные на нем символы с этими. Там ничего общего нет.

Добавлено через 5 минут
Delphi
1
2
3
4
5
6
var
  s: UTF8String;
begin
  s:= #209#128#208#176#209#129#209#128#208#176#209#129;
  Memo1.Lines.Add(s);
  Memo1.Lines.Add(Utf8ToAnsi(s));
Каким образом вы с 'TА¦-TБTА¦-TБ' получили s:= #209#128#208#176#209#129#209#128#208#176#209#129 , если не секрет?
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
03.09.2013, 17:42 8
Еще раз: из 'TА¦-TБTА¦-TБ' я ничего не получал, потому что это мусор, у которого ни один байт не соответствует оригиналу, показанному вам перекодировщиком в третьем посте. Бинарные данные через буфер обмена так просто не копируются.

А строка эта -- просто синтаксически корректная запись именно той, исходной последовательности, которая при копировании через буфер обмена и превратилась у вас в 'TА¦-TБTА¦-TБ'. См. скриншот.
Изображения
 
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
03.09.2013, 17:46  [ТС] 9
Цитата Сообщение от quwy Посмотреть сообщение
Еще раз: из 'TА¦-TБTА¦-TБ' я ничего не получал, потому что это мусор, у которого ни один байт не соответствует оригиналу, показанному вам перекодировщиком в третьем посте. Бинарные данные через буфер обмена так просто не копируются.

А строка эта -- просто синтаксически корректная запись именно той, исходной последовательности, которая при копировании через буфер обмена и превратилась у вас в 'TА¦-TБTА¦-TБ'. См. скриншот.
Не очень могу понять как мне это поможет с TА¦-TБTА¦-TБ вернуть обратно расрас
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
03.09.2013, 17:50 10
Цитата Сообщение от Chipito Посмотреть сообщение
Не очень могу понять как мне это поможет с TА¦-TБTА¦-TБ вернуть обратно расрас
Блин. Последний раз: 'TА¦-TБTА¦-TБ' никак ни во что не преобразовать, потому что это не та строка, которую вы получаете из заголовка архива. Не та строка, это мусор, который получился от небрежного обращения с бинарной строкой! Вы что, сами не видите, что и на вашем скриншоте, и на моем, первый символ это нифига не 'T', а третий -- не '¦'?
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
03.09.2013, 17:54  [ТС] 11
Цитата Сообщение от quwy Посмотреть сообщение
Блин. Последний раз: 'TА¦-TБTА¦-TБ' никак ни во что не преобразовать, потому что это не та строка, которую вы получаете из заголовка архива. Не та строка, это мусор, который получился от небрежного обращения с бинарной строкой! Вы что, сами не видите, что и на вашем скриншоте, и на моем, первый символ это нифига не 'T', а третий -- не '¦'?
Понял, вопрос снят.
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
03.09.2013, 17:58 12
Есть вероятность, что некорректная перекодировка была сделана еще на этапе упаковки. Но проверить это просто -- откройте архив любым готовым архиватором и посмотрите какие символы видит он.
0
0 / 0 / 0
Регистрация: 20.11.2011
Сообщений: 29
03.09.2013, 22:45  [ТС] 13
Цитата Сообщение от quwy Посмотреть сообщение
Есть вероятность, что некорректная перекодировка была сделана еще на этапе упаковки. Но проверить это просто -- откройте архив любым готовым архиватором и посмотрите какие символы видит он.
Так и есть, я ж говорю что это проблема в php, но к сожалению ее не удалось решить. В архиве файлы с такими же именами.
0
Native x86
Эксперт Hardware
5650 / 3390 / 957
Регистрация: 13.02.2013
Сообщений: 10,746
04.09.2013, 01:17 14
Цитата Сообщение от Chipito Посмотреть сообщение
Так и есть, я ж говорю что это проблема в php, но к сожалению ее не удалось решить. В архиве файлы с такими же именами.
Тогда вы непонятно выразились. Копайте пых, потому как то, что вам напаковал, -- нечитаемо в принципе. Скорее всего вам нужно перед передачей строки архиватору, преобразовать ее в однобайтовыю кодировку (866 или 1251).
0
пофигист широкого профиля
4754 / 3191 / 860
Регистрация: 15.07.2013
Сообщений: 18,482
04.09.2013, 01:30 15
Цитата Сообщение от Chipito Посмотреть сообщение
Так и есть, я ж говорю что это проблема в php, но к сожалению ее не удалось решить. В архиве файлы с такими же именами.
Если сломался мой холодильник и в нём испортилось мясо, я это мясо есть не стану!
0
04.09.2013, 01:30
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
04.09.2013, 01:30
Помогаю со студенческими работами здесь

Конвертация из CP866 в UTF-8 данных из dbf файла
Здравствуйте, коллеги. Вопрос таков: есть DBF-файл, состоит из пяти полей. Строковые данные в...

getBytes('UTF-16') даёт UTF-16LE или UTF-16BE?
Добрый день! Делаю J2ME-клиента к некому серверу, исходников которого у меня нет, но есть...

<globalization fileEncoding='utf-8' requestEncoding='utf-8' responseEncoding='utf-8' />
Если в коде пишу строку скажем Response.Write ('Вася дурак') - все срабатывает нормально, а если в...

Конвертация из ASCII в UTF-32 или UTF-8 в UTF-32
Собсно сабж.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Блоги программистов
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
Полезные поделки на Arduino, которые можно сделать самому
raxper 06.01.2025
Arduino как платформа для творчества Arduino представляет собой удивительную платформу для технического творчества, которая открывает безграничные возможности для создания уникальных проектов. Эта. . .
Подборка решений задач на Python
IT_Exp 06.01.2025
Целью данной подборки является предоставление возможности ознакомиться с различными задачами и их решениями на Python, что может быть полезно как для начинающих, так и для опытных программистов. . . .
С чего начать программировать микроконтроллер­­ы
raxper 06.01.2025
Введение в мир микроконтроллеров Микроконтроллеры стали неотъемлемой частью современного мира, окружая нас повсюду: от простых бытовых приборов до сложных промышленных систем. Эти маленькие. . .
Из чего собрать игровой компьютер
inter-admin 06.01.2025
Сборка игрового компьютера требует особого внимания к выбору комплектующих и их совместимости. Правильно собранный игровой ПК не только обеспечивает комфортный геймплей в современных играх, но и. . .
Обновление сайта www.historian.b­y
Reglage 05.01.2025
Обещал подвести итоги 2024 года для сайта. Однако начну с того, что изменилось за неделю. Добавил краткий урок по последовательности действий при анализе вредоносных файлов и значительно улучшил урок. . .
Как использовать GraphQL в C# с HotChocolate
Programming 05.01.2025
GraphQL — это современный подход к разработке API, который позволяет клиентам запрашивать только те данные, которые им необходимы. Это делает взаимодействие с API более гибким и эффективным по. . .
Модель полного двоичного сумматора с помощью логических операций (python)
AlexSky-coder 04.01.2025
def binSum(x:list, y:list): s=^y] p=x and y for i in range(1,len(x)): s. append((x^y)^p) p=(x and y)or(p and (x or y)) return s x=list() y=list()
Это мы не проходили, это нам не задавали...(аси­­­­­­­­­­­­­­­­­­­­х­р­о­н­н­ы­й счётчик с управляющим сигналом задержки).
Hrethgir 04.01.2025
Асинхронный счётчик на сумматорах (шестиразрядный по числу диодов на плате, но наверное разрядов будет больше - восемь или шестнадцать, а диоды на старшие), так как триггеры прошли тестирование и. . .
Руководство по созданию бота для Телеграм на Python
IT_Exp 04.01.2025
Боты для Телеграм представляют собой автоматизированные программы, которые выполняют различные задачи, взаимодействуя с пользователями через интерфейс мессенджера. В данной статье мы рассмотрим,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru