Вылетает YAGF (распознавание текста)

Офисные пакеты, текстовые и табличные процессоры и т.д.
Правила форума
Как правильно задавать вопросы Правильно сформулированный вопрос и его грамотное оформление способствует высокой вероятности получения достаточно содержательного и по существу ответа. Общая рекомендация по составлению тем: 1. Версия ОС вместе с разрядностью. Пример: LM 18.1 x64, LM Sarah x32 2. DE. Если вопрос касается двух, то через запятую. (xfce, KDE, cinnamon, mate) 3. Какое железо. (достаточно вывод inxi -Fxz в спойлере (как пользоваться спойлером смотрим здесь)) или же дать ссылку на hw-probe 4. Суть. Желательно с выводом консоли, логами. 5. Скрин. Просьба указывать 1, 2 и 3 независимо от того, имеет ли это отношение к вопросу или нет. Так же не забываем об общих правилах Как пример вот
Аватара пользователя

colonel
Сообщения: 1851
Зарегистрирован: 18 дек 2016, 09:08
Решено: 21
Откуда: Хартленд, N
Благодарил (а): 44 раза
Поблагодарили: 497 раз

Вылетает YAGF (распознавание текста)

Сообщение colonel » 04 мар 2019, 15:18

Candandi писал(а):
03 мар 2019, 16:40
я не уверен, что вы меня понимаете
ну почему же., прекрасно понимаю что вы ничего поняли, и не разобрались в настройках.
начнём по порядку
1
Candandi писал(а):
03 мар 2019, 16:40
Судя по вашему скрину, у меня не такая версия, как у вас (у меня 0.9.3.2).
на втором скрине в #19 специально было показано окно YAGF - Опрограмме
1.png
2
Candandi писал(а):
03 мар 2019, 16:40
У вас интерфейс програмки иначе выглядит.
это с чего это такие выводы? где и чего там не так? Да и никто не мешает получить такой же интерфейс
- окно выбора языка распознавания в верхней панели
5.png
появляется только при выключенной в настройках опции "Только один язык"
- в этом окошке отображаются языки только отмеченные(включенные) в окне "Выбор языков для распознавания" (том что на первом скрине в #19 ) в соответствии с тем какая программа распознавания включена в настройках и какие языки отмечены для этих программ.
- окошко в верхней панели после включения как указано выше появится после перезапуска окна YAGF или ,например может появиться после переключения настроек внешнего вида программы(изменения размера иконок)
- и ещё дополнительные кнопочки в поле окна выделения блоков для распознавания появятся после загрузки картинки с текстом.
3
Мне просто нужно, чтоб работало распознавание русского текста. Выбираю русский язык везде, где только можно, но после нажатия OK вижу, что мои настройки не сохранились. Все остается по-прежнему!
хотеть это правильно, вот только чтобы хотелка сбылась мало просто хотеть и жмакать по кнопкам , желательно ещё и смотреть что , где ,как и попытаться понять чего не сделано из того что нужно.
в общем , несмотря на отсутствие кофейной гущи для гадания ,
... есть большое подозрение что для распознавания русского текста в tesseract, у вас не установлен пакет tesseract-ocr-rus (установить можно в синнаптике -Манагере пакетов)
Если языковый пакет tesseract не установлен то хоть "завыбирайтесь" до посинения но тесаракт не будет распознавать текст на этом языке. и тд и тп .
У вас нет необходимых прав для просмотра вложений в этом сообщении.
"Не ты выбираешь Linux, а Linux выбирает тебя"
(с)Себастьян Перейра, торговец чёрным деревом


Candandi
Сообщения: 30
Зарегистрирован: 22 апр 2018, 18:19
Благодарил (а): 22 раза
Поблагодарили: 2 раза

Вылетает YAGF (распознавание текста)

Сообщение Candandi » 29 дек 2019, 03:57

Вернулся к проблеме почти год спустя. Тогда побился и забросил. Советы, которые давал Colonel в марте, успеха сами по себе не принесли.
Но сейчас я понимаю, что частично и они помогли, я был на верном пути, но нужно было догадаться сделать пару неочевидных мелочей в настройках.
Значит, по порядку, что я делал. Через менеджер пакетов установил tesseract-ocr-rus. Не помогло.
Обнаружил отсутствие и решил поставить пакет tesseract-ocr (плюс то, что шло к нему прицепом), не помогло. Тогда на всякий случай установил и GImageReader, потому что это советовали на первой странице установить наряду с перечисленным. Не помогло (не знаю, было ли и нужно).
Но тут заметил, что в меню "Выбрать языки для распознавания - Tesseract" (на скриншоте) английский язык пометился иным типом ярлычка (таким же, какой был у русского). Ну то есть оба языка стали доступны, как я теперь понимаю. Поставил чекбокс на обоих ярлычках; чекбокс с "Только один язык" в очередной раз убрал. И о чудо, проблема решилась. На главной появилась кнопка для переключения языка.
Создатель программы, вряд ли вы прочтете это. Но, воля ваша, надо было вам вставить в программу предупреждение типа "Внимание! Вы убрали чекбокс с "Только один язык", но помните ли вы, что в списке языков вы выбрали гораздо меньше, чем два языка"?
Супедогадливым, может быть, такое предупреждение и не нужно. Радуйтесь, если вы в их числе. Я нет.
Заодно заметил странную вещь. Если выделить кусок текста (в том числе точно весь текст, или даже "с запасом"), потом через ПКМ нажать "распознать блок", распознается только меньшая часть слов, причем часто с грубыми ошибками (раз на раз не приходится). Автоматическая разбивка текста на блоки, с последующим распознанием - дает то же самое.
И только если ничего не выделяя, сразу нажать на кнопку с красным "OCR" (скрин), распознается весь текст, и, если качество изображения идеальное, без слишком густых ошибок.

Но в целом, качество распознавания более-менее сложных текстов уже достаточно неважное. Древний ABBYY FineReader, которым я пользовался на винде 15 лет назад, и тот, пожалуй, справлялся лучше.
У вас нет необходимых прав для просмотра вложений в этом сообщении.

Аватара пользователя

colonel
Сообщения: 1851
Зарегистрирован: 18 дек 2016, 09:08
Решено: 21
Откуда: Хартленд, N
Благодарил (а): 44 раза
Поблагодарили: 497 раз

Вылетает YAGF (распознавание текста)

Сообщение colonel » 29 дек 2019, 15:12

Candandi писал(а):
29 дек 2019, 03:57
....Советы, которые давал Colonel в марте, успеха сами по себе не принесли.
советы сами по себе успеха не приносят нужно же ещё и думать что делаешь
Candandi писал(а):
29 дек 2019, 03:57
...что я делал. Через менеджер пакетов установил tesseract-ocr-rus. Не помогло.
Обнаружил отсутствие и решил поставить пакет tesseract-ocr (плюс то, что шло к нему прицепом), не помогло. ....
с какого бодуна установка языкового пакета tesseract-ocr-rus поможет если сама программа tesseract-ocr не была установлена.
Это как установить только пакет firefox-locale-ru но пытаться запустить firefox и ожидать что инетбраузер
Это очевидно надо было догадаться что вы пытались устанавливать русский язык не установив самой программы , хотя по ходу обсуждения в теме предполагается что программы распознавания CuneiForm и tesseract-ocr - уже УСТАНОВЛЕНЫ !!!
#1 > Установил CuneiForm, оболочку YAGF и aspell-ru. .......вылетает.
#2 > ...Решилось установкой GImageReader + tesseract-ocr + tesseract-ocr-rus.
и был указан и пакет tesseract-ocr-rus (про пакеты что ставятся автоматом по зависимостям обычно не упоминают)
Candandi писал(а):
29 дек 2019, 03:57
.... Тогда на всякий случай установил и GImageReader, потому что это советовали на первой странице установить наряду с перечисленным. Не помогло
GImageReader - это "графический GTK+ front-end для tesseract-ocr" - графическая оболочка для работы с программой распознавания текста tesseract-ocr.
Её то установка с какого пришитого к валенку крючка поможет работе YAGF? И кто вам советовал это ставить ?
Билл Вильямс поставил эту пргограмму поскольку у него не "заработал" YAGF с CuneiForm .
Candandi писал(а):
29 дек 2019, 03:57
....о чудо, проблема решилась.
поздравляю. не прошло и года как проблема решилась чудесным образом.
Candandi писал(а):
29 дек 2019, 03:57
....надо было ....(автору программы) вставить в программу предупреждение типа "Внимание! Вы убрали чекбокс с "Только один язык" ....
а может пользователям программы следует перед тем как тыцкать по кнопкам ознакомиться с программой и её настройками?

Похоже что тему вы читали не обдумывая что ни по какому поводу написано.
Candandi писал(а):
29 дек 2019, 03:57
Заодно заметил странную вещь. Если выделить кусок текста ..... ....
....... и, если качество изображения идеальное, без слишком густых ошибок.
ну чего странного то
сказано было ещё в #9 > "качество распознавания зависит и от качества картинки (чёткости, контрастности и размера картинки с текстом ) и от типа шрифта" (аналогичное говорится и в публикациях в инете )
а вот насчёт того что при выделении блоков хуже распознаёт .....
ну не знаю. вот при минимуме обработки (только обрезал и увеличил немного )
выделил три блока считалось так же как и при при выделении всего текста (ессно только то что было в блоках)
Screenshot at 2019-12-29 21_48_48.png
Candandi писал(а):
29 дек 2019, 03:57
Древний ABBYY FineReader, которым я пользовался на винде 15 лет назад, и тот, пожалуй, справлялся лучше.
великое открытие однако сделано
так никто не мешает купить ABBYY FineReader что под линукс и пользоваться.

" ABBYY FineReader – один из лидеров рынка OCR,..... Он выпускается в версиях под все ОС Windows, а также под ОС Mac OS X и Linux."
(c)http://blogerator.org/page/ocr_abbyy-fi ... -tesseract

https://zenway.ru/page/abbyy-finereader-for-linux

Ну а если не устраивает платная консольная проф. программа , или невмоготу разобраться с установленными свободными программами , или не хочется обрабатывать картинки с текстом до нормального состояния для распознавания текста
можно пользоваться онлайновыми решениями . Есть такие и от abbyy-finereader.
Есть и от других производителей , например, - онлайн сервис распознавания https://www.ocrconvert.com/
У вас нет необходимых прав для просмотра вложений в этом сообщении.
"Не ты выбираешь Linux, а Linux выбирает тебя"
(с)Себастьян Перейра, торговец чёрным деревом


Candandi
Сообщения: 30
Зарегистрирован: 22 апр 2018, 18:19
Благодарил (а): 22 раза
Поблагодарили: 2 раза

Вылетает YAGF (распознавание текста)

Сообщение Candandi » 30 дек 2019, 07:54

colonel, который раз замечаю - познания вас переполняют до такой степени, что на вежливость ни капельки места не остается.

В сети
Аватара пользователя

symon2014
Сообщения: 3655
Зарегистрирован: 16 дек 2017, 18:59
Решено: 20
Откуда: Феодосия
Благодарил (а): 17 раз
Поблагодарили: 410 раз

Вылетает YAGF (распознавание текста)

Сообщение symon2014 » 30 дек 2019, 10:59

Не по теме
Candandi, Не наезжай на нашего полковника. У него язва и он сам язва , но дело знает туго. :-D

Аватара пользователя

Whowka
Сообщения: 880
Зарегистрирован: 20 июл 2018, 16:50
Решено: 3
Откуда: Питер
Благодарил (а): 386 раз
Поблагодарили: 267 раз

Вылетает YAGF (распознавание текста)

Сообщение Whowka » 30 дек 2019, 13:50

Не по теме

Вернуться в «Офис и документы»