recoll Поиск в документах

Как правильно задавать вопросы Правильно сформулированный вопрос и его грамотное оформление способствует высокой вероятности получения достаточно содержательного и по существу ответа. Общая рекомендация по составлению тем: 1. Для начала воспользуйтесь поиском форума. 2. Укажите версию ОС вместе с разрядностью. Пример: LM 19.3 x64, LM Sarah x32 3. DE. Если вопрос касается двух, то через запятую. (xfce, KDE, cinnamon, mate) 4. Какое железо. (достаточно вывод inxi -Fxz в спойлере (как пользоваться спойлером смотрим здесь)) или же дать ссылку на hw-probe 5. Суть. Желательно с выводом консоли, логами. 6. Скрин. Просьба указывать 2, 3 и 4 независимо от того, имеет ли это отношение к вопросу или нет. Так же не забываем об общих правилах Как пример вот
Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#1

07 май 2019, 20:38

Recoll is a desktop full-text search tool

Recoll — свободная программная система локального полнотекстового поиска.

Не могу заставить recoll индексировать файлы/каталоги на 2-м HDD и внешних носителях через консоль.
Через GUI индексирование проходит.

Индексирование для файлов в домашней папке:

Код: Выделить всё

$ ls "$HOME/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "$HOME/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:764::Db::add: docid 15 added [/home/demonlibra/111|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 16 added [/home/demonlibra/111/1.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 17 added [/home/demonlibra/111/3.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 18 added [/home/demonlibra/111/2.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 19 added [/home/demonlibra/111/4.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 20 added [/home/demonlibra/111/5.pdf|]
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 6 nowakes 6 wsleeps 7 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 6 nowakes 1 wsleeps 9 csleeps 2
:3:./utils/workqueue.h:196::Split: tasks 6 nowakes 6 wsleeps 8 csleeps 0

Индексирование для файлов на 2-м HDD

Код: Выделить всё

$ ls "/mnt/data/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "/mnt/data/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 0 nowakes 0 wsleeps 4 csleeps 0
:3:./utils/workqueue.h:196::Split: tasks 0 nowakes 0 wsleeps 2 csleeps 0

В файле настроек $HOME/.recoll/recoll.conf параметр skippedPaths пуст

Код: Выделить всё

skippedPaths = 
Обновлял версию 1.23.7-1 из стандартного репозитория, до последней 1.25.12. Результат не изменился.

Код: Выделить всё

$ sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on
$ sudo apt upgrade
recoll -v
Recoll 1.25.12 + Xapian 1.4.5
Есть кто пользуется этой программой? Прошу помощи.
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#2

08 май 2019, 09:57

Прошу модератора исправить ссылку в начале сообщения.

Код: Выделить всё

[url=https://linuxmint.com.ru/recoll.org]Recoll[/url]
заменить на

Код: Выделить всё

[url=https://www.recoll.org]Recoll[/url]
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

rogoznik
Сообщения: 10042
Зарегистрирован: 27 июн 2017, 13:36
Решено: 129
Откуда: Нижний Тагил
Благодарил (а): 776 раз
Поблагодарили: 1956 раз
Контактная информация:

recoll Поиск в документах

#3

08 май 2019, 10:07

demonlibra писал(а):
08 май 2019, 09:57
Прошу модератора исправить ссылку в начале сообщения.
Готово
ИзображениеИзображение

Аватара пользователя

FreeStyler
Сообщения: 798
Зарегистрирован: 23 июл 2018, 07:58
Решено: 6
Откуда: Сиб
Благодарил (а): 756 раз
Поблагодарили: 94 раза
Контактная информация:

recoll Поиск в документах

#4

08 май 2019, 12:14

darkfenix, хм, всё равно битая получается ибо он не чует https https://recoll.org http://recoll.org

Прикольно, он с индексацией даже. А я как-то на пыхе хотел написать для сайтика :-D
deadmau5 - Harmonic Mix
■ KDE Neon 22.04 (UE) @ Lenovo IdeaPad 3-15 Ryzen 5 4500U, 18 Гб DDR-4, 128 Gb SSD +1 Gb SSD 1920x1080

Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#5

08 май 2019, 12:34

Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/

Это все мелочи. Меня вопрос индексации через консоль интересует.
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

rogoznik
Сообщения: 10042
Зарегистрирован: 27 июн 2017, 13:36
Решено: 129
Откуда: Нижний Тагил
Благодарил (а): 776 раз
Поблагодарили: 1956 раз
Контактная информация:

recoll Поиск в документах

#6

08 май 2019, 13:20

demonlibra писал(а):
08 май 2019, 12:34
Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/
Поменял
ИзображениеИзображение

Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#7

08 май 2019, 18:36

Попробовал на xubuntu live. Результат тот же. Индексирует только на первом жестком диске.
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#8

09 май 2019, 16:01

Нашел заветную опцию -f

Код: Выделить всё

-f tells recollindex to ignore file selection parameters from the configuration.
Никаких исключений в настройках не нашел, но с этой опцией индексирование заработало.

Код: Выделить всё

find "где_искать" -print | recollindex -c "временный_путь_для_базы" -i -e -f
или в полном виде с фильтрацией по типам файлов

Код: Выделить всё

find "где_искать" -type f -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" -print | recollindex -c "временный_путь_для_базы" -i -e -f
Искал эту возможность для функции поиска строки в документах из контекстного меню Nemo
https://github.com/demonlibra/nemo-acti ... emo_action
https://github.com/demonlibra/nemo-acti ... ch_text.sh
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Аватара пользователя

Автор темы
demonlibra
Сообщения: 844
Зарегистрирован: 12 авг 2017, 09:09
Решено: 13
Откуда: Ростов-на-Дону
Благодарил (а): 29 раз
Поблагодарили: 204 раза
Контактная информация:

recoll Поиск в документах

#9

09 май 2019, 18:44

Исправляюсь

Код: Выделить всё

find "где_искать" -type f \( -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" \) -print | recollindex -c "временный_путь_для_базы" -i -e -f
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD

Закрыто

Вернуться в «Офис и документы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 10 гостей