it-swarm-es.com

¿Cómo recortar un archivo pdf de varias páginas (imagen / escaneada) (que no se recortará con pdfcrop)?

Por lo general, estoy bastante contento de usar pdfcropNAME _ , aunque el resultado recortado generalmente consume mucho más espacio en disco. Tenga en cuenta que existe código comparable , que soluciona y resuelve este problema. Sin embargo, si quiero recortar un archivo pdf escaneado (imagen), mi impresión es que pdfcropsimplemente falla. Me imagino que ImageMagickNAME _ es capaz de hacer el truco, posiblemente (también) haciéndonos de pdftkNAME _ .

Estoy buscando un código eficiente de una línea (un script de varias líneas también estaría bien ...) para recortar un archivo PDF de arriba a abajo, izquierda y derecha por x cm cada uno (o, mejor aún, por abcd cm, individualmente), yendo desde input.pdf hasta output.pdf.

ps: la solución no necesita involucrar ImageMagickname__; Estoy feliz siempre y cuando funcione (de manera limpia, confiable y eficiente) ...;)

5
nutty about natty

El crédito completo se debe a AlexG quien incidentalmente en passant publicó una solución a este problema aquí , que, por razones de integridad y para que no se pierda (!), cito a continuación.

Relevante para la pregunta anterior es la opción de recorte descrita en la man:

Ejemplos de uso:

#default operation
pdfcrop.sh orig.pdf cropped.pdf
pdfcrop.sh -m 10 orig.pdf cropped.pdf
pdfcrop.sh -hires orig.pdf cropped.pdf

#trimming pages
pdfcrop.sh -t "10 20 30 40" orig.pdf trimmed.pdf

Contenido de pdfcrop.sh:

#!/bin/bash

function usage () {
  echo "Usage: `basename $0` [Options] <input.pdf> [<output.pdf>]"
  echo
  echo " * Removes white margins from each page in the file. (Default operation)"
  echo " * Trims page edges by given amounts. (Alternative operation)"
  echo
  echo "If only <input.pdf> is given, it is overwritten with the cropped output."
  echo
  echo "Options:"
  echo
  echo " -m \"<left> [<top> [<right> <bottom>]]\""
  echo "    adds extra margins in default operation mode. Unit is bp. A single number"
  echo "    is used for all margins, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom margins alike."
  echo
  echo " -t \"<left> [<top> [<right> <bottom>]]\""
  echo "    trims outer page edges by the given amounts. Unit is bp. A single number"
  echo "    is used for all trims, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom trims alike."
  echo
  echo " -hires"
  echo "    %%HiResBoundingBox is used in default operation mode."
  echo
  echo " -help"
  echo "    prints this message."
}

c=0
mar=(0 0 0 0); tri=(0 0 0 0)
bbtype=BoundingBox

while getopts m:t:h: opt
do
  case $opt
  in
    m)
    eval mar=($OPTARG)
    [[ -z "${mar[1]}" ]] && mar[1]=${mar[0]}
    [[ -z "${mar[2]}" || -z "${mar[3]}" ]] && mar[2]=${mar[0]} && mar[3]=${mar[1]}
    c=0
    ;;
    t)
    eval tri=($OPTARG)
    [[ -z "${tri[1]}" ]] && tri[1]=${tri[0]}
    [[ -z "${tri[2]}" || -z "${tri[3]}" ]] && tri[2]=${tri[0]} && tri[3]=${tri[1]}
    c=1
    ;;
    h)
    if [[ "$OPTARG" == "ires" ]]
    then
      bbtype=HiResBoundingBox
    else
      usage 1>&2; exit 0
    fi
    ;;
    \?)
    usage 1>&2; exit 1
    ;;
  esac
done
shift $((OPTIND-1))

[[ -z "$1" ]] && echo "`basename $0`: missing filename" 1>&2 && usage 1>&2 && exit 1
input=$1;output=$1;shift;
[[ -n "$1" ]] && output=$1 && shift;

(
    [[ "$c" -eq 0 ]] && gs -dNOPAUSE -q -dBATCH -sDEVICE=bbox "$input" 2>&1 | grep "%%$bbtype"
    pdftk "$input" output - uncompress
) | Perl -w -n -s -e '
  BEGIN {@m=split /\s+/, $mar; @t=split /\s+/, $tri;}
  if (/BoundingBox:\s+([\d\.\s]+\d)/) { Push @bbox, $1; next;}
  elsif (/\/MediaBox\s+\[([\d\.\s]+\d)\]/) { @mb=split /\s+/, $1; next; }
  elsif (/pdftk_PageNum\s+(\d+)/) {
    $p=$1-1;
    if($c){
      $mb[0]+=$t[0];$mb[1]+=$t[1];$mb[2]-=$t[2];$mb[3]-=$t[3];
      print "/MediaBox [", join(" ", @mb), "]\n";
    } else {
      @bb=split /\s+/, $bbox[$p];
      $bb[0]+=$mb[0];$bb[1]+=$mb[1];$bb[2]+=$mb[0];$bb[3]+=$mb[1];
      $bb[0]-=$m[0];$bb[1]-=$m[1];$bb[2]+=$m[2];$bb[3]+=$m[3];
      print "/MediaBox [", join(" ", @bb), "]\n";
    }
  }
  print;
' -- -mar="${mar[*]}" -tri="${tri[*]}" -c=$c | pdftk - output "$output" compress
3

Puede probar briss. Es bastante simple, pero hace el trabajo. Sin embargo, es una aplicación GUI.

Descargue el archivo Zip y extráigalo en una carpeta de su elección y comience:

Java -jar briss-0.9.jar

Para instalarlo de forma permanente y en todo el sistema y poder iniciarlo desde cualquier lugar con solo briss, desempaquete la descarga en /usr/local/lib/, luego cree un archivo ejecutable /usr/local/bin/briss que contenga:

#!/bin/sh
Java -jar /usr/local/lib/briss-0.9/briss-0.9.jar
13
phoibos

Este es el mejor y más fácil y tiene una GUI maravillosa: Krop

Descargar deb del autor: http://arminstraub.com/computer/krop

Revisión: http://www.hecticgeek.com/2013/08/crop-pdf-ubuntu-13-04-krop/

Editar: Estoy usando krop desde la 13.10 y noté que las últimas versiones comenzaron a admitir la apertura de un pdf con krop con un clic derecho. También cambié a la versión instantánea desde que estuvo disponible y también admite el clic derecho, confirmado en 18.10 y 19.04. La GUI no es tan colorida con la versión instantánea, pero la funcionalidad es la misma:

Sudo snap install krop
10
Consumology