recoll Поиск в документах

Офисные пакеты, текстовые и табличные процессоры и т.д.
Правила форума
Как правильно задавать вопросы Правильно сформулированный вопрос и его грамотное оформление способствует высокой вероятности получения достаточно содержательного и по существу ответа. Общая рекомендация по составлению тем: 1. Версия ОС вместе с разрядностью. Пример: LM 18.1 x64, LM Sarah x32 2. DE. Если вопрос касается двух, то через запятую. (xfce, KDE, cinnamon, mate) 3. Какое железо. (достаточно вывод inxi -Fxz в спойлере (как пользоваться спойлером смотрим здесь)) или же дать ссылку на hw-probe 4. Суть. Желательно с выводом консоли, логами. 5. Скрин. Просьба указывать 1, 2 и 3 независимо от того, имеет ли это отношение к вопросу или нет. Так же не забываем об общих правилах Как пример вот
Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 07 май 2019, 17:38

Recoll is a desktop full-text search tool

Recoll — свободная программная система локального полнотекстового поиска.

Не могу заставить recoll индексировать файлы/каталоги на 2-м HDD и внешних носителях через консоль.
Через GUI индексирование проходит.

Индексирование для файлов в домашней папке:

Код: Выделить всё

$ ls "$HOME/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "$HOME/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:764::Db::add: docid 15 added [/home/demonlibra/111|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 16 added [/home/demonlibra/111/1.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 17 added [/home/demonlibra/111/3.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 18 added [/home/demonlibra/111/2.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 19 added [/home/demonlibra/111/4.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 20 added [/home/demonlibra/111/5.pdf|]
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 6 nowakes 6 wsleeps 7 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 6 nowakes 1 wsleeps 9 csleeps 2
:3:./utils/workqueue.h:196::Split: tasks 6 nowakes 6 wsleeps 8 csleeps 0

Индексирование для файлов на 2-м HDD

Код: Выделить всё

$ ls "/mnt/data/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "/mnt/data/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 0 nowakes 0 wsleeps 4 csleeps 0
:3:./utils/workqueue.h:196::Split: tasks 0 nowakes 0 wsleeps 2 csleeps 0

В файле настроек $HOME/.recoll/recoll.conf параметр skippedPaths пуст

Код: Выделить всё

skippedPaths = 
Обновлял версию 1.23.7-1 из стандартного репозитория, до последней 1.25.12. Результат не изменился.

Код: Выделить всё

$ sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on
$ sudo apt upgrade
recoll -v
Recoll 1.25.12 + Xapian 1.4.5
Есть кто пользуется этой программой? Прошу помощи.
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 08 май 2019, 06:57

Прошу модератора исправить ссылку в начале сообщения.

Код: Выделить всё

[url=https://linuxmint.com.ru/recoll.org]Recoll[/url]
заменить на

Код: Выделить всё

[url=https://www.recoll.org]Recoll[/url]
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

darkfenix
Сообщения: 5583
Зарегистрирован: 27 июн 2017, 10:36
Решено: 62
Откуда: Нижний Тагил
Благодарил (а): 308 раз
Поблагодарили: 1037 раз

recoll Поиск в документах

Сообщение darkfenix » 08 май 2019, 07:07

demonlibra писал(а):
08 май 2019, 06:57
Прошу модератора исправить ссылку в начале сообщения.
Готово
Изображение

Аватара пользователя

FreeStyler
Сообщения: 476
Зарегистрирован: 23 июл 2018, 04:58
Решено: 2
Откуда: Сиб
Благодарил (а): 517 раз
Поблагодарили: 62 раза

recoll Поиск в документах

Сообщение FreeStyler » 08 май 2019, 09:14

darkfenix, хм, всё равно битая получается ибо он не чует https https://recoll.org http://recoll.org

Прикольно, он с индексацией даже. А я как-то на пыхе хотел написать для сайтика :-D
deadmau5 - Chill Mix
■ Mint 19 KDE (initial Xfce) @ Intel NUC Skull Canyon, i7-6770HQ, 16Gb RAM, 512Gb SSD M2, Iris Graphics 580
■ KDE Neon (Ubuntu 18.04) @ Lenovo V110 15ISK, i3-6006u, 8Gb RAM, 32GB SSD, 640GB HDD, HD Graphics 520

Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 08 май 2019, 09:34

Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/

Это все мелочи. Меня вопрос индексации через консоль интересует.
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

darkfenix
Сообщения: 5583
Зарегистрирован: 27 июн 2017, 10:36
Решено: 62
Откуда: Нижний Тагил
Благодарил (а): 308 раз
Поблагодарили: 1037 раз

recoll Поиск в документах

Сообщение darkfenix » 08 май 2019, 10:20

demonlibra писал(а):
08 май 2019, 09:34
Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/
Поменял
Изображение

Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 08 май 2019, 15:36

Попробовал на xubuntu live. Результат тот же. Индексирует только на первом жестком диске.
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 09 май 2019, 13:01

Нашел заветную опцию -f

Код: Выделить всё

-f tells recollindex to ignore file selection parameters from the configuration.
Никаких исключений в настройках не нашел, но с этой опцией индексирование заработало.

Код: Выделить всё

find "где_искать" -print | recollindex -c "временный_путь_для_базы" -i -e -f
или в полном виде с фильтрацией по типам файлов

Код: Выделить всё

find "где_искать" -type f -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" -print | recollindex -c "временный_путь_для_базы" -i -e -f
Искал эту возможность для функции поиска строки в документах из контекстного меню Nemo
https://github.com/demonlibra/nemo-acti ... emo_action
https://github.com/demonlibra/nemo-acti ... ch_text.sh
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 180
Зарегистрирован: 12 авг 2017, 06:09
Решено: 1
Благодарил (а): 5 раз
Поблагодарили: 55 раз

recoll Поиск в документах

Сообщение demonlibra » 09 май 2019, 15:44

Исправляюсь

Код: Выделить всё

find "где_искать" -type f \( -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" \) -print | recollindex -c "временный_путь_для_базы" -i -e -f
ZXSpectrum→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-19
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Вернуться в «Офис и документы»