Катологизирую
Давно собирался сделать дайджест своей библиотечки пдфок и прочих диджевюшек для относительно быстрого поиска.Вот например, журнал "Радио" 376 номеров в формате djvu, запаришься искать что-либо нужное.
На радиофорумах аксакалы обычно держат всё в голове, на лету вспоминая содержание номера 10 за 1984 год, но это не наш метод, ибо технологии шагнули вперёд, используем для этого всю мощь IBM PC! Полистав журналы вижу, что содержание плавает от номера к номеру на страницах 2-4, придётся их все выдирать и сортировать.
Выдираем искомые три странички:
Поскольку в ранних номерах страницы чёрно-белые, а ближе к современности - цветные, поэтому перегоняю всё в оттенки серого с помощью pdftoppm:
и в ждпеги:
Мусор удалим:
И вот получилось по три страницы каждого номера, из которых надо выбрать оглавление, вручную что ж поделать. Но так как демон tumblerd не покладая рук делает из фоток превъюшки, то цели прекрасно видны.

Ну вот, всё говно слито и получилось оглавление каждого номера.
Жпеги переименовываю:
Перегоняю в PDF:
На все страницы прилеплю штамп с номером номера :D , где-нибудь вверху на полях
Готовлю штампы:
Теперь совмещаю каждую страничку с её штампом:
ОК

Всё собираю в один файл:
Уф,пдфка в 65 мб получилась.
Скачать
На радиофорумах аксакалы обычно держат всё в голове, на лету вспоминая содержание номера 10 за 1984 год, но это не наш метод, ибо технологии шагнули вперёд, используем для этого всю мощь IBM PC! Полистав журналы вижу, что содержание плавает от номера к номеру на страницах 2-4, придётся их все выдирать и сортировать.
Выдираем искомые три странички:
for file in *.djvu;do ddjvu -format=pdf -page=2,3,4 $file ~/digest/$file.pdf;done
cd ~/digest
Поскольку в ранних номерах страницы чёрно-белые, а ближе к современности - цветные, поэтому перегоняю всё в оттенки серого с помощью pdftoppm:
for file in *.pdf;do pdftoppm -gray -r 100 $file $file.pgm;done
и в ждпеги:
for file in *.pgm;do convert $file $file.jpg;done
Мусор удалим:
rm *.pdf *.pgm
И вот получилось по три страницы каждого номера, из которых надо выбрать оглавление, вручную что ж поделать. Но так как демон tumblerd не покладая рук делает из фоток превъюшки, то цели прекрасно видны.

Ну вот, всё говно слито и получилось оглавление каждого номера.
Жпеги переименовываю:
rename 's/.djvu.pdf.pgm-..pgm//' *
Перегоняю в PDF:
for file in *.jpg;do convert $file -density 72 -page A4 -type optimize $file.pdf;done
rm *.jpg
rename 's/.jpg//' *.pdf
На все страницы прилеплю штамп с номером номера :D , где-нибудь вверху на полях
Готовлю штампы:
for file in *.pdf;do content=$(echo $file | sed 's/\.pdf//g');convert -page A4 -pointsize 24 -gravity northwest label:$content stamp_$file;done
Теперь совмещаю каждую страничку с её штампом:
for file in !(stamp*);do root=$(echo $file | sed 's/\.pdf//');pdftk $file stamp stamp$file output new_$root;done
rm *.pdf
ОК

Всё собираю в один файл:
pdftk * output radio_digest.pdf
Уф,пдфка в 65 мб получилась.
Скачать