BiTel

Форум BiTel
bgbilling.ru     docs.bitel.ru     wiki.bitel.ru     dbinfo.bitel.ru     bgcrm.ru     billing.bitel.ru     bitel.ru    
Текущее время: 28 апр 2024, 01:21

Часовой пояс: UTC + 5 часов [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 45 ]  На страницу 1, 2  След.

переведёте ли БД на utf-8
да 57%  57%  [ 8 ]
нет; всё равно в чём хранится, работает и ладно 7%  7%  [ 1 ]
нет; хотелось бы, но страшно 7%  7%  [ 1 ]
есть тестовый сервер+БД, её переведу 29%  29%  [ 4 ]
Всего голосов : 14
Автор Сообщение
 Заголовок сообщения: utf-8 бд
СообщениеДобавлено: 05 фев 2013, 18:12 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
С 5.3 планируется всю работу с БД, а также почти все остальные взаимодействия перевести на UTF-8. Новые базы будут создаваться уже в UTF-8, старые без перекодировки работать тоже будут (ну планируется по крайней мере). Но свою тестовую мы хотим перекодировать для чистоты эксперимента. Так что новые разработки тестироваться будут уже как будто база в UTF-8.
Вопрос: будете ли вы перекодировать свою БД? Или оставите в 1251? И почему. И вообще какие мысли на этот счёт? Дискасс!

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 05 фев 2013, 18:36 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 29 мар 2010, 23:11
Сообщения: 5854
Карма: 472
А можно услышать причины? Что изменится для конечного пользователя? Новые плюшки или что-то из-за чего стоит вообще это делать?
Так например переходя с 5.1 на 5.2 я знал что мне нужны шаблоны договора в новом FOP, модуль Inet в будущем ну и еще пара плюшек о которых я уже не упомню.

А тут что будет нового? :)

да, лень читать в интернете. я знаю что там будет поддерживаться больше кодировок и блаблабла, что символ в cp1251 весит 1 байт а в утф8 - 2 байта... Но, что это даст в данном конкретном случае?

_________________
Цитаты великих людей :umnik:
Напишите в helpdesk © stark
повторяю: => хелпдеск => доработка => профит © dimOn
свершилось... © skn
Мой код изящен, лёгок, оригинален, краток. Как прохладный весенний ветерок, как звонкий ручей! © dimOn
Вежливый разработчик © Artur
Эти баги тоже исправлены, как и те, которые еще не написаны © Artur
ну т.е. существует воркэраунд, ок © dimOn


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 05 фев 2013, 19:55 
Не в сети

Зарегистрирован: 05 окт 2007, 13:36
Сообщения: 1073
Карма: 46
давно пора, что тут обсуждать.

_________________
интеграция биллинга с 1с http://bgbilling-1c.ru/


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 05 фев 2013, 22:51 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
dimOn писал(а):
С 5.3 планируется всю работу с БД, а также почти все остальные взаимодействия перевести на UTF-8.

Изображение


dimOn писал(а):
Новые базы будут создаваться уже в UTF-8

Надеюсь это будет utf8_general_ci, т.к. согласно ману:
Цитата:
For any Unicode character set, operations performed using the xxx_general_ci collation are faster than those for the xxx_unicode_ci collation. For example, comparisons for the utf8_general_ci collation are faster, but slightly less correct, than comparisons for utf8_unicode_ci. The reason for this is that utf8_unicode_ci supports mappings such as expansions; that is, when one character compares as equal to combinations of other characters.



dimOn писал(а):
старые без перекодировки работать тоже будут (ну планируется по крайней мере)

Доступ будет через SET NAMES? Смысл?


dimOn писал(а):
будете ли вы перекодировать свою БД?

Да, буду. Да, это:
Код:
cat <<TXT > bgb.sql
DROP DATABASE IF EXISTS bgbilling;
CREATE DATABASE bgbilling DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
USE bgbilling;
TXT

mysqldump --quick --single-transaction --default-character-set=cp1251 bgbilling >> bgb.sql

cat bgb.sql | iconv -f CP1251 -t UTF-8 > bgb.utf

mysql --default-character-set=utf8 < bgb.utf

займет немного времени, но UTF-изация того стоит, ящитаю.


Phricker писал(а):
А можно услышать причины? Что изменится для конечного пользователя?

Люди наконец то смогут использовать родные языки.


Phricker писал(а):
символ в cp1251 весит 1 байт а в утф8 - 2 байта

Это, пожалуй, единственный геморрой.



Единственный, пока не ясный для меня момент - это кодировка динкода. Если БД будет в UTF, то код, наверное, тоже надо будет конвертить, т.к. русская "строка" в 1251 и "строка" в UTF (цифрам пофиг, речь про строчки поиска, например) - это разные строки, не?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 05 фев 2013, 23:05 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 29 мар 2010, 23:11
Сообщения: 5854
Карма: 472
snark писал(а):
dimOn писал(а):
С 5.3 планируется всю работу с БД, а также почти все остальные взаимодействия перевести на UTF-8.

Изображение
Phricker писал(а):
А можно услышать причины? Что изменится для конечного пользователя?

Люди наконец то смогут использовать родные языки.

Узнал что аллилуя пишется через два Л )))

А для меня родной - русский. Так что я просто присоединюсь ко всеобщей радости )

_________________
Цитаты великих людей :umnik:
Напишите в helpdesk © stark
повторяю: => хелпдеск => доработка => профит © dimOn
свершилось... © skn
Мой код изящен, лёгок, оригинален, краток. Как прохладный весенний ветерок, как звонкий ручей! © dimOn
Вежливый разработчик © Artur
Эти баги тоже исправлены, как и те, которые еще не написаны © Artur
ну т.е. существует воркэраунд, ок © dimOn


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 06:38 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
Phricker писал(а):
Узнал что аллилуя пишется через два Л )))

Аллилуйа/аллилуиа слышал, а что такое "аллилуя"? )))


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 08:39 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 20 апр 2009, 12:03
Сообщения: 3092
Откуда: Иркутск
Карма: 338
dimOn писал(а):
Вопрос: будете ли вы перекодировать свою БД?

А насколько это критично? Плюсы, минусы? Какие могут быть проблемы, если не перекодировать?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 10:15 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 03 авг 2009, 18:42
Сообщения: 7166
Откуда: Благовещенск
Карма: 241
эээээ, я тоже не в теме, для меня это очередной гемор при переходе

_________________
Код:
  Клиент: вер. 6.2.714 / 25.05.2015 17:27:15
    os: Linux; java: Java HotSpot(TM) 64-Bit Server VM, v.1.8.0_45
  Сервер: вер. 6.2.881 / 22.05.2015 17:56:55
    os: Linux; java: Java HotSpot(TM) 64-Bit Server VM, v.1.8.0_45
Помощь по администрированию bgbilling в jabber конференции или Группа в telegram
Стиль программирования - пьяный мастерстер
Разработка мобильных приложений


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 11:16 
Не в сети
Клиент

Зарегистрирован: 20 мар 2008, 20:20
Сообщения: 676
Откуда: Россия, Иваново
Карма: 36
Гемор конечно будет, но перекодировать базу на utf8 будем.
Главное продумать процесс перекодировки базы более детально.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 12:03 
Не в сети
Разработчик

Зарегистрирован: 08 ноя 2007, 01:05
Сообщения: 8343
Откуда: Уфа
Карма: 238
Никто не говорит об обязательной конвертации . Хотели сделать поддержку utf8 для тех, кто хочет конвертировать, и для новых клиентов рекомендовать utf8.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 12:07 
Не в сети
Разработчик

Зарегистрирован: 08 ноя 2007, 01:05
Сообщения: 8343
Откуда: Уфа
Карма: 238
snark писал(а):


Единственный, пока не ясный для меня момент - это кодировка динкода. Если БД будет в UTF, то код, наверное, тоже надо будет конвертить, т.к. русская "строка" в 1251 и "строка" в UTF (цифрам пофиг, речь про строчки поиска, например) - это разные строки, не?


Дин код итак уже в utf8 . Это не связано с кодировкой базы


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 13:57 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
Phricker писал(а):
А можно услышать причины? Что изменится для конечного пользователя? Новые плюшки или что-то из-за чего стоит вообще это делать?
Так например переходя с 5.1 на 5.2 я знал что мне нужны шаблоны договора в новом FOP, модуль Inet в будущем ну и еще пара плюшек о которых я уже не упомню.

А тут что будет нового? :)

да, лень читать в интернете. я знаю что там будет поддерживаться больше кодировок и блаблабла, что символ в cp1251 весит 1 байт а в утф8 - 2 байта... Но, что это даст в данном конкретном случае?

Изменится то, что однобайтовые кодировки — зло. Потенциальный гемор с кодировками и кракозябрами в дальнейшем уменьшается на порядки.
Новых фишек это не даст, просто стандарт это и везде если utf-8, то это хорошо.

Символ кириллицы занимает 2 байта, да. Но русских символов относительно общего объёма БД там 1% наберётся ли? В основном размер то всякие логи, и прочая шняга. Ну вырастет размер базы на 0.5% — это некритично, имхо.

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 14:03 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
snark писал(а):
dimOn писал(а):
старые без перекодировки работать тоже будут (ну планируется по крайней мере)

Доступ будет через SET NAMES? Смысл?

Не, обмен с сервером от кодировки базы мало зависит, драйвер и драйвер jdbc сам решает чего там как.
Т.е. у нас сейчас уже некоторые сидят на юникодной базе.

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 06 фев 2013, 14:04 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
Cromeshnic писал(а):
dimOn писал(а):
Вопрос: будете ли вы перекодировать свою БД?

А насколько это критично? Плюсы, минусы? Какие могут быть проблемы, если не перекодировать?

Пока не знаем, но скоро узнаем :idea:

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 07 фев 2013, 18:00 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
Вопрос возник ещё такой интересный. Что делать с выгружаемыми файлами csv, например. С одной стороны однобайтовые кодировки там парфозны, с другой будет много вопросов про «неправильные шрифты в экселе» ©.

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 07 фев 2013, 18:27 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
Один раз укажут кодировку и вопрос отпадет, но будет задаваться другими :(

Изображение


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 08 фев 2013, 12:37 
Не в сети
Разработчик

Зарегистрирован: 08 ноя 2007, 01:05
Сообщения: 8343
Откуда: Уфа
Карма: 238
snark писал(а):
Один раз укажут кодировку и вопрос отпадет, но будет задаваться другими :(

Изображение


А это excell ? Или openoffice/libreoffice?. У меня винды под руками нет , поэтому не могу проверить в excell, почему то мне запомнилось что он не спрашивает кодировку при открытии csv-файлов . В openoffice/libreoffice то проблем нет - там сразу окошко вылетает с выбором кодировки при открытии.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 08 фев 2013, 14:35 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
поздно, я везде уже поменял

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 08 фев 2013, 14:38 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
stark писал(а):
А это excell ? Или openoffice/libreoffice?

Это openoffice, но можу и на ёкселе проверить если надо.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 09 фев 2013, 00:14 
Не в сети

Зарегистрирован: 29 ноя 2006, 17:16
Сообщения: 133
Карма: 5
О. ну таки здравый смысл восторжествовал! Одобрям-с целиком и полностью...
Менять однозначно. Особенно тем, у кого биллинг вертится на Linux...

А лучше всем и сразу, дабы вообще забыть тему кодировок как класс. Писать данные в базу можно будет на любом языке...

Минус, кроме дополнительной операции при апгрейде, база станет больше. Точнее та часть, что отвечает за договора. Это мизер, если у вас база хранит данные за 3-4 года...

В общем всё правильно делаете, ребята... Желаю вам удачи.

Я, к счастью или к сожалению, из телекома ушёл в разработку и уже наверное не ваш клиент. Но должен сказать, что BG-Billing оставил впечатление надежного, рабочего продукта. Особенно на фоне всяких UTM и LAN-billing'ов наших партнеров. За 6-7 лет эксплуатации серьезных сбоев по вине биллинга не было ни разу... Но backup'ы всё равно рулят... ))

_________________
С уважением...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 29 мар 2013, 20:15 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 24 июн 2009, 17:49
Сообщения: 640
Карма: 10
У кого-нибудь есть успешный опыт конвертации? Есть какие-нибудь грабли?
Хочу попробовать конвертнуться в utf :)

Сервер 5.2 сборка 1443


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 11:33 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
У некоторых из наших клиентов база всегда была в utf-8, вроде всё работало. По сути никакой разницы биллингу нету, мы проверяли :)

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 12:48 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 24 июн 2009, 17:49
Сообщения: 640
Карма: 10
А у меня сконвертить не получается :(
iconv спотыкается на символах 0x098:
iconv: illegal input sequence at position ...

а этих символов в дампе базы чуть менее чем много...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 14:58 
Не в сети
Аватара пользователя

Зарегистрирован: 30 май 2008, 15:51
Сообщения: 6055
Карма: 244
а как конвертитуете то?

_________________
I'm clever. I've got a computer.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 16:50 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
Скорее всего так:
Код:
cat dump_cp1251.sql | iconv -f CP1251 -t UTF-8 > dump_utf8.sql

Но походу в дампе есть табличка с модулями лежащими в БД и на ней iconv спотыкается.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 17:30 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 24 июн 2009, 17:49
Сообщения: 640
Карма: 10
Цитата:
а как конвертитуете то?


Код:
mysqldump -u root -p --quick --single-transaction --default-character-set=cp1251 -r original.sql bgbilling
iconv -f CP1251 -t UTF-8 -o utf.sql original.sql


Цитата:
Но походу в дампе есть табличка с модулями лежащими в БД и на ней iconv спотыкается.

точно

P.S.
Базу я уже грохнул и создал изначально уникодовой :)


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 17:42 
Не в сети
Клиент

Зарегистрирован: 12 фев 2008, 18:10
Сообщения: 3951
Карма: 249
Делай дамп _без_ таблички с модулями - все прокатит.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 19:56 
Не в сети
Разработчик

Зарегистрирован: 08 ноя 2007, 01:05
Сообщения: 8343
Откуда: Уфа
Карма: 238
snark писал(а):
Делай дамп _без_ таблички с модулями - все прокатит.

Не факт.. Еще есть поля, где хранится xml целиком(счета в бухгалтерии, и другие места есть). Там 2 случая
1) xml уже в utf8, тогда конвертер ее испортит .
2) xml в cp1251, то конвертер поменяет ее содержимое на правильное , но не поменяет заголовок , поэтому при чтении они неправильно будет интерпретироваться, в этом случае заголовок отдельным запросом поправить нужно.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 01 апр 2013, 20:01 
Не в сети
Разработчик

Зарегистрирован: 08 ноя 2007, 01:05
Сообщения: 8343
Откуда: Уфа
Карма: 238
Еще есть способ через alter table ..convert .
http://deer.org.ua/2009/08/02/1/

Но с xml опять те же проблемы .


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: utf-8 бд
СообщениеДобавлено: 02 апр 2013, 11:18 
Не в сети
Клиент
Аватара пользователя

Зарегистрирован: 24 июн 2009, 17:49
Сообщения: 640
Карма: 10
Кстати, хоть я и получил в итоге utf8 базу (пересоздав) и хоть я и коннекчусь к ней из сервера по utf8:
db.url=jdbc:mysql://127.0.0.1/bgbilling?useUnicode=true&characterEncoding=utf8&allowUrlInLocalInfile=...
и домашний кабинет открывается тоже в utf8, все равно иноязычные символы будучи вбиты - например - в новости, отображаются и клиенте и в домашнем кабинете как вопросики.... :(


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 45 ]  На страницу 1, 2  След.

Часовой пояс: UTC + 5 часов [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
POWERED_BY
Русская поддержка phpBB
[ Time : 0.522s | 80 Queries | GZIP : On ]