[/b/] [/d/] [/tu/] [/a/] [/34/] [/ph/] [/wa/] [/cg/] [/t/]
Умнач, имеется свалка порядка 200k fb2 книг с ничего не значащими именами файлов. Ищется какой-нибудь софт, который мог бы привести это в какое-то подобие порядка, вроде выборки по авторам или по жанрам. Предпочитаемая платформа - linux, но в принципе подойдут и другие варианты.
>>70674http://www.lesbonscomptes.com/recoll/упарываю два года, зависимости никакой.
>>70675Валится с сегфолтом на индексировании не проиндексировав и тысячи.
>>70678уминявсёработаетxapian у тебя какой?
>>70678уминявсёработает
xapian у тебя какой?
>>706851.2.5
>>70687ну я не знаю. а какой дистр? а сколько бит? а по мелчочи есть чо?
>>70689Гента, 64х битная. По мелочи что?
>>70690>По мелочи что?полтишок, на пивас не хватает, братан.какой у тебя реколл? у меня вот 1.16.0 на точно такой же конфигурации сутками непрерывно безо всяких проблем индексировал, может в ипстрим закрался баг. или ты что-то делаеь не так, читай её логи перед падением. ну или едро переко-ко-компелируй, в конце концов.алсо можешь опробовать гугльдесктоп, но он вроде fb2 и произвольный текст не индексирует.
>>70690
>По мелочи что?
полтишок, на пивас не хватает, братан.
какой у тебя реколл? у меня вот 1.16.0 на точно такой же конфигурации сутками непрерывно безо всяких проблем индексировал, может в ипстрим закрался баг. или ты что-то делаеь не так, читай её логи перед падением. ну или едро переко-ко-компелируй, в конце концов.
алсо можешь опробовать гугльдесктоп, но он вроде fb2 и произвольный текст не индексирует.
>>70692> 1.16.0Аналогичный.> логи перед падениемВарианты разнообразные, например:3:../internfile/internfile.cpp:281:FileInterner:: ignored: [/path/to/lib] mime [application/x-fsdirectory]или Qt has caught an exception thrown from an event handler. Throwing exceptions from an event handler is not supported in Qt. You must reimplement QApplication::notify() and catch all exceptions there. terminate called after throwing an instance of 'std::length_error' what(): basic_string::append Аварийный остановно чаще всего просто молча умирает с сегфолтом.> произвольный текст не индексируетИ не нужно. Дотстаточно название книги, жанр, автора и имя файла.
>>70692
> 1.16.0
Аналогичный.
> логи перед падением
Варианты разнообразные, например
:3:../internfile/internfile.cpp:281:FileInterner:: ignored: [/path/to/lib] mime [application/x-fsdirectory]
или
Qt has caught an exception thrown from an event handler. Throwing exceptions from an event handler is not supported in Qt. You must reimplement QApplication::notify() and catch all exceptions there.
terminate called after throwing an instance of 'std::length_error' what(): basic_string::append Аварийный останов
но чаще всего просто молча умирает с сегфолтом.
> произвольный текст не индексирует
И не нужно. Дотстаточно название книги, жанр, автора и имя файла.
>>70674Calibre, не?
>>70768Похоже именно то, что надо, если оно подобный объем сожрет, что станет известно после нескольких дней индексации.
Похоже не судьба мне этим счастьем попользоваться.> ERROR: Ошибка при добавлении: Процесс добавления книг, видимо, завис. Попробуйте перезапустить calibre и добавить книги меньшими порциями до тех пор пока не найдете проблемную книгу.При этом в базу добавлено порядка 18к книг и интерфейс жутко тормозит.
Похоже не судьба мне этим счастьем попользоваться.
> ERROR: Ошибка при добавлении: Процесс добавления книг, видимо, завис. Попробуйте перезапустить calibre и добавить книги меньшими порциями до тех пор пока не найдете проблемную книгу.
При этом в базу добавлено порядка 18к книг и интерфейс жутко тормозит.
>>70821ПРЫЩЕБЛЯДИКС, СЭРя бы всё же разобрался почему у тебя не работает реколл или опробовал гуглписечку.
>>70821ПРЫЩЕБЛЯДИКС, СЭР
я бы всё же разобрался почему у тебя не работает реколл или опробовал гуглписечку.
>>70839> я бы всё же разобрался почему у тебя не работает реколлУ меня нет опыта отлова сегфолтов в чужом быдлокоде, увы. Тем более это не совсем то, что нужно.
>>70839
> я бы всё же разобрался почему у тебя не работает реколл
У меня нет опыта отлова сегфолтов в чужом быдлокоде, увы. Тем более это не совсем то, что нужно.
Попробуй проанализировать несколько файлов и посмотреть, где и как указывается автор/жанр/etc.Далее, напиши скрипт, читающий начало/заголовки файла и выгребающий оттуда соответствующие данные. База составляется при помощи stdout >> file, выборка — grep'ом, сортировка — sort'ом. Удобно, нэ?
>>70845> Попробуй проанализировать несколько файлов и посмотреть, где и как указывается автор/жанр/etc.Там xml внутри.Сейчас пользуюсь текстовым файлом, в котором записано имя файла и первые его 15 строк, вполне удобно, только enca не везде отработал правильно и размер файла получился в 400 метров. Если не найду ничего подходящего, скорее всего напишу собственный парсер этого добра и запихну все куда-нибудь в mysql базу.
>>70845
> Попробуй проанализировать несколько файлов и посмотреть, где и как указывается автор/жанр/etc.
Там xml внутри.Сейчас пользуюсь текстовым файлом, в котором записано имя файла и первые его 15 строк, вполне удобно, только enca не везде отработал правильно и размер файла получился в 400 метров. Если не найду ничего подходящего, скорее всего напишу собственный парсер этого добра и запихну все куда-нибудь в mysql базу.
- wakaba 3.0.7 + futaba + futallaby -