Dedicado a mis proyectos en Gambas ,un lenguaje de programación parecido al Visual Basic + Java pero ampliamente mejorado y...¡¡para gnu/linux!!.La potencia del gnu/linux sumada a la facilidad del Basic



Consultas, Desarrollo de programas y petición de presupuestos:



Mostrando entradas con la etiqueta pdf. Mostrar todas las entradas
Mostrando entradas con la etiqueta pdf. Mostrar todas las entradas

miércoles, 31 de mayo de 2023

Imprimir todos los archivos EXCEL de un directorio a .PDF con libreoffice

 



Necesita imprimir en formato .PDF cientos de ficheros que tengo en una carpeta de hojas de calculo de excel. Buscando encontré enta web: https://ciberninjas.com/5-cosas-que-puedes-hacer-con-libreoffice-desde-la-linea-de-comandos/ y 

En mi caso, tengo la impresora por defecto del tipo .PDF, (osea cuando imprimo, lo que hace es crear un fichero pdf) y con el siguiente comando lo conseguí hacer en un instante:


libreoffice -p *.xlxs


Para más opciones y comandos visita la pagina de referencia:

https://ciberninjas.com/5-cosas-que-puedes-hacer-con-libreoffice-desde-la-linea-de-comandos/

domingo, 22 de enero de 2023

Editar Marcadores de Pdf: MASTER PDF EDITOR

 

      Editar Marcadores de Pdf:         MASTER PDF EDITOR







MASTER PDF EDITOR, que te permite (en su versión gratuita) editar y modificar los marcadores de los pdf que tengas. Tiene versiones para windows, linux y mac.




Tiene una versión de pago que te permite hacer muchas mas cosas, pero el tema de los marcadores no he encontrado ningún otro programa gratuito que lo haga.

Enlace:

https://code-industry.net/

https://code-industry.net/free-pdf-editor/

martes, 8 de febrero de 2022

Como imprimir todos los ficheros tipo .xlsx a pdf, sin abrirlos, que esten en una misma carpeta: Con libreoffice

 Como imprimir todos los ficheros tipo .xlsx a pdf, sin abrirlos, que esten en una misma carpeta:

 Con libreoffice


En la linea de comando:

libreoffice --headless --convert-to pdf *.xlsx

FUENTE:
https://askubuntu.com/questions/777162/how-to-convert-excel-spreadsheet-2007-to-pdf-in-linux

miércoles, 24 de noviembre de 2021

ocr a un pdf usando tesseract

 


OCR a un pdf usando tesseract

1º Paso: convertir cada pagina del pdf a png:

Usar el siguiente comando en la terminal, suponiendo que el fichero se llame nombre.pdf:

$pdftoppm -png nombre.pdf  nombre

Creará tantos ficheros .png como páginas haya:

nombre-01.png

nombre-02.png

.....


2º Escanear las paginas generadas (formato .png) usando el idioma español:

$for i in nombre-??.png; do tesseract "$i" "text-$i" -l spa; done;

Y crea tantos ficheros .txt como páginas haya.


3º Unimos todos los ficheros txt que ha generado:

$cat text-nombre* > unidos.txt


Finalmente en el fichero "unidos.txt" estará todo el texto que haya podido extraer del pdf.

Ahora nos toca revisarlo :)


Fuente:

https://www.howtogeek.com/682389/how-to-do-ocr-from-the-linux-command-line-using-tesseract/


OTRA FORMA:

find ./ -name "*.jpg" | sort | while read file; do tesseract "$file" "`basename "$file" | sed 's/\.[[:alnum:]]*$//'`.txt" -l spa -psm 3; done



martes, 14 de abril de 2020

Modificación de PDF: buscar y reemplazar texto internamente en un fichero PDF

Modificación del contenido de un PDF: buscar y reemplazar texto internamente en un fichero PDF


Os dejo una pequeña aplicación para cambiar el contenido de texto de un fichero de .pdf



Características:
- Puede hacer hasta 5 buscar/reemplazar, a la vez, en el fichero
- Indica si se han realizado los reemplazos (iconito de ok o cancel)
- Le he añadido un sistema de "perfiles" parar guardar la información que tiene que buscar y reemplazar.

A mi me es útil, porque suelo hacer muchos cambios en varios ficheros  



Instalador .deb y codigo fuente:
https://drive.google.com/drive/folders/1IjVcFB-Q3Po6exZPDrY0goYWcD6ptTVt?usp=sharing

Fuente:
https://www.gambas-es.org/viewtopic.php?f=5&p=47904#p47904


Video tutorial de ejemplo de uso:


jueves, 23 de enero de 2020

Resolver convert-im6.q16: not authorized

Resolver convert-im6.q16: not authorized


Usando el comando convert, me ha salido el error de  "convert-im6.q16: not authorized"

¿como se arregla?

Encontré este enlace donde lo explican. Básicamente lo que hay que cambiar es una linea del fichero "policy.xml" que se encuentra en la carpeta /etc/ImageMagick-6

La linea es:
<policy domain="coder" rights="none" pattern="PDF" />
y se reemplaza por:
<policy domain="coder" rights="read|write" pattern="PDF" />


Nota:
Para editar el fichero "policy.xml", tenemos que hacerlo como administrador:

sudo nano /etc/ImageMagick-6/policy.xml




domingo, 28 de julio de 2019

Qgis: enlazar con Ficheros PDF, rutas relativas y acciones...

Qgis: enlazar con  Ficheros PDF, rutas relativas y acciones...


Os dejo 3 videos, donde os comento como poner un campo de ruta relativa que apunta a un fichero pdf (para poderlo abrir como hiperenlace), y que pasa cuando cambiamos de ruta el proyecto como configurar los campos para que no haya problemas con los enlaces y acciones definidas.








Saludos

domingo, 12 de noviembre de 2017

[Productividad]: Editar PDF con LibreOffice DRAW


[Productividad]: 

Editar PDF con LibreOffice DRAW

LibreOffice Draw es un editor de gráficos vectoriales y herramienta de diagramación, similar a Microsoft Visio y con características muy parecidas a las que poseían las primeras versiones de la aplicación gráfica CorelDRAW, y a los programas de maquetación para publicaciones como Scribus y Microsoft Publisher. Ofrece «conectores» entre las formas, disponibles en una gama de diferentes estilos de líneas y facilitan la construcción de gráficos, como por ejemplo diagramas de flujo. También incluye la posibilidad de exportar sus creaciones en formato PDF y al estándar SVG

Y a la wikipedia, se le ha olvidado añadir  que podemos EDITAR los PDF, de una forma muy sencilla, y por supuesto guardar los cambios en formato PDF.




En el siguiente video os dejo un ejemplo de edición de un con libreoffice draw




Editando páginas con pdfshuffler y pdftk:



Descargar:
https://es.libreoffice.org/descarga/libreoffice-estable/

Version Portable:
https://www.libreoffice.org/download/portable-versions/


Fuentes:
https://es.wikipedia.org/wiki/LibreOffice



martes, 4 de julio de 2017

PdfShuffler: Ejemplo de uso. Modificando pdfs


PdfShuffler

 Ejemplo de uso:

 Modificando Archivos PDF




En la entrada http://jsbsan.blogspot.com.es/2017/06/pequena-chuleta-de-pdftk-y-herramienta.html
, donde os dejaba una "chuleta" para tener a mano en caso de querer modificar pdf, os comentaba que de manera visual podíamos usar la herramienta pdfshuffler para rotar, mover, y eliminar páginas del pdf (para trabajar con consola usabamos pdftk).   Os dejo un video donde os explico con más detalles tanto la instalación de esta aplicación como el uso de este programa.


Referencias:
http://jsbsan.blogspot.com.es/2017/06/pequena-chuleta-de-pdftk-y-herramienta.html




viernes, 30 de junio de 2017

Pequeña Chuleta de pdftk y herramienta visual para modificaar archivos pdf: pdfshuffler



Pequeña Chuleta de pdftk y herramienta visual para modificar archivos pdf: pdfshuffler










Chuleta PDFTK:

Extraer varias paginas de un pdf:
pdftk A=nombre-de-archivo.pdf cat A52-57 output salida.pdf
Nota:
Extrae desde la pagina 52 a la pagina 57 creando un fichero "salida.pdf"

Extraer todas las página de un pdf, creando un pdf por cada página:

pdftk archivo_grande.pdf burst



UNIR VARIOS FICHEROS:
pdftk *.pdf cat output archivo_final.pdf
Truco:
Podemos usar "*" si los archivos deben de estar nombrados con un número delante ( 01,02,03, etc..) y asi se añaden en el orden que queramos. Si no es así, tendremos que poner el nombre de cada archivos que queramos unir.


Quitar una pagina:
pdftk trabajo.pdf cat 1-3 5-end output trabajo_final.pdf
Nota:
De esta manera quito la pagina 4 del documento.
Invertir el orden de las páginas de un pdf
 pdftk memoria.pdf cat end-1 output memoria_inversa.pdf





Herramienta visual para mover, eliminar, rotar páginas:
pdfshuffler







Referencias:
http://jsbsan.blogspot.com.es/2016/12/terminal-modificar-archivos-pdf-con.html

https://miguelmenendez.pro/es/articulos/unir-concatenar-archivos-pdf-sistemas-gnu-linux-linea-comandos.html

https://fortinux.com/tutoriales/linux-2-tutoriales/tutorial-extraer-paginas-de-archivos-pdf-con-pdftk-en-linux/

https://eliasbrasa.wordpress.com/2011/01/24/como-quitar-paginas-a-un-pdf-en-ubuntu/

https://lignux.com/pdf-shuffler-un-metodo-simple-de-editar-documentos-en-pdf/

http://www.tribulinux.com/como-separar-y-unir-archivos-pdf-en-ubuntu-con-pdftk.html

lunes, 16 de enero de 2017

Como se hizo.... MicroComando extraepaginapdf



Como se hizo.... MicroComando extraepaginapdf


Os dejo un pequeño video donde comento el código fuente de este programa que extrae las paginas de un pdf, usando por debajo de él, el programa pdftk:









Nota:
Para la descarga del programa visita este enlace:
 http://jsbsan.blogspot.com.es/2017/01/desarrollo-terminal-microcomandos.html


Saludos


domingo, 15 de enero de 2017

[Desarrollo Terminal]: MicroComandos hechos en gambas3

[Desarrollo]: 

MicroComandos hechos en gambas3


Aunque el punto fuerte de gambas3, es realizar aplicaciones gráficas de forma muy rápida, también podemos desarrollar aplicaciones para la terminal. En este artículo os traigo un ejemplo de ello.



El problema:
Se me plantea esta semana un trabajo donde tengo que trabajar con varios pdf y que debo de "trocear" (extraer páginas) de ellos. La solución inicial, es usar el comando pdftk, por ejemplo:

Si quiero extraer desde la página 52 hasta la 57 (ambas inclusive) del pdf "origen.pdf", y guardarlas en el archivo "salida.pdf", el comando seria así:

$pdftk A=origen.pdf cat A52-57 output salida.pdf

¿y si creo un comando más simple (más corto) para hacer lo mismo? Por ejemplo, algo así como:

$extraepaginapdf 52 57

Este comando, buscaría el primer archivo .pdf que se encuentre en el directorio actual, le extrae las páginas desde la 52 hasta la 57, y genera un archivo salida.pdf.

Bueno, pues lo he creado para que por defecto funcione así. Además tiene la opción de ponerle un nombre distinto al archivo de salida.

Os dejo un video para que veais como funciona:




Enlace de descarga: alojado en google drive




Fuentes:
http://jsbsan.blogspot.com.es/2016/12/terminal-modificar-archivos-pdf-con.html
https://fortinux.com/tutoriales/linux-2-tutoriales/tutorial-extraer-paginas-de-archivos-pdf-con-pdftk-en-linux/

viernes, 2 de diciembre de 2016

[Terminal]: Modificar archivos pdf con PDFtk


[Terminal]:
 Modificar archivos pdf con PDFtk

Con el programa pdtk, podemos manipular archivos pdf desde la terminal. Os dejo unos cuantos ejemplos realizados por el autor de este programa. ( Nota: He encontrado un editor online http://www.pdfescape.com/ , que no tiene tantas opciones como pdftk, pero es "visual" y puede ser útil en determinadas ocasiones. )




Instalación:

sudo apt-get install pdftk



Ejemplo de usos:

Agrupar las páginas:

pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf

  O si odd.pdf está en orden inverso:

pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf



Únase a in1.pdf y in2.pdf en un nuevo PDF, out1.pdf

pdftk in1.pdf in2.pdf cat output out1.pdf


 O (usando cat):
pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf

  O (usando comodines):

pdftk *.pdf cat output combined.pdf


Eliminar la página 13 de in1.pdf para crear out1.pdf

pdftk in.pdf cat 1-12 14-end output out1.pdf

   o:

pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf



Gire la primera página PDF a 90 grados en el sentido de las agujas del reloj

pdftk in.pdf cat 1east 2-end output out.pdf


Rotar un documento PDF completo a 180 grados

pdftk in.pdf cat 1-endsouth output out.pdf


Únete a dos archivos, uno de los cuales requiere la contraseña foopass. La salida no está cifrada.

pdftk A=secured.pdf 2.pdf input_pw A=foopass cat output 3.pdf

Descifrar un PDF

pdftk secured.pdf input_pw foopass output unsecured.pdf


Cifrar un PDF con una intensidad de 128 bits (la predeterminada), retener todos los permisos (el valor predeterminado

pdftk 1.pdf output 1.128.pdf owner_pw foopass

Igual que arriba, excepto baz de la contraseña también se debe utilizar para abrir la salida PDF

pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz


Igual que el anterior, excepto que se permite la impresión (una vez abierto el PDF)

pdftk 1.pdf output 1.128.pdf owner_pw foo user_pw baz allow printing

Aplicar cifrado de 40 bits a la salida, revocando todos los permisos (el valor predeterminado). Establezca el propietario PW a foopass.

pdftk 1.pdf 2.pdf cat output 3.pdf encrypt_40bit owner_pw foopass


Descomprimir flujos de páginas PDF para editar el PDF en un editor de texto (por ejemplo, vim, emacs)

pdftk doc.pdf output doc.unc.pdf uncompress


Reparar una tabla XREF corrupta de PDF y longitudes de secuencia, si es posible

pdftk broken.pdf output fixed.pdf

Crear un pdf por cada pagina de otro fichero PDF (actualizado 24/04/2018)
pdftk in.pdf burst

    Nota: Nos nombre los ira renombrando (pg_0001.pdf, pg_0002.pdf, etc...)

Escribir un informe sobre metadatos y marcadores de documentos PDF para report.txt

  • pdftk in.pdf dump_data output report.txt



Traducido del artículo original de Sid Steward




Fuentes:
https://www.pdflabs.com/docs/pdftk-cli-examples/
http://www.redeszone.net/2015/03/06/pdftk-para-linux-manipula-cualquier-pdf-traves-de-la-linea-de-comandos/

miércoles, 18 de febrero de 2015

TRUCO: Crear un programa para rellenar un impreso y convertirlo en pdf( 2º parte)

TRUCO: 

Crear un programa para rellenar un impreso y convertirlo en .pdf (2º parte)


En la entrada de la 1º parte  (enlace), explique como rellenar un impreso y convertirlo a formato  .svg


En el siguiente video tienes la explicación:



Ahora vamos a ver dos cosas más:
1) Como rellenar varias lineas
2) Como convertir el archivo .svg en formato .pdf

Vamos a ello:

1) Rellenar varias lineas.
Si necesitamos rellenar un texto largo, lo suyo es que por cada linea pongamos un código. En la siguiente captura vemos que en la plantilla .svg, he añadido varias DatosObservacionesXX ( DatosObservaciones01,DatosObservaciones02,DatosObservaciones03) para poder asi tener 3 lineas a rellenar


En el formulario del programas lo que haremos es tener un textbox por cada linea que queramos rellenar.

Nota:
Se podria tener en cuenta el limite de caracteres que nos caben en una linea y avisar al usuario que no lo supere, pero esto depende mucho  del tipo de letra y tamaño que tengan en la etiqueta del .svg.


2) Como convertir el archivo .svg en formato .pdf
 Para convertir el archivo .svg a .pdf, tendremos que usar el programa
rsvg-convert , que se instala de la siguiente forma:

$ sudo apt-get install librsvg2-bin

La linea en gambas seria:

 Shell "rsvg-convert -f pdf -o /tmp/rellenado.pdf /tmp/rellenado.svg" Wait

Os dejo aqui el código completo:


' Gambas class file

Public Sub _new()

End

Public Sub Form_Open()

End

Public Sub ButtonRellenar_Click()

Dim contenido As String

contenido = File.Load("plantilla.svg")

contenido = Replace(contenido, "DatoNif", TextBoxNIf.text)
contenido = Replace(contenido, "DatoNombre", TextBoxNombre.text)
contenido = Replace(contenido, "DatoMunicipio", TextBoxMunicipio.text)
contenido = Replace(contenido, "DatoProvincia", TextBoxProvincia.text)
contenido = Replace(contenido, "DatoObservacion01", TextBox1.text)
contenido = Replace(contenido, "DatoObservacion02", TextBox2.text)
contenido = Replace(contenido, "DatoObservacion03", TextBox3.text)

File.Save("/tmp/rellenado.svg", contenido)

Shell "rsvg-convert -f pdf -o /tmp/rellenado.pdf /tmp/rellenado.svg" Wait

'Nota: Tienes que activar el compoenente gb.desktop
'y tener instalado librsvg2-bin
'con el siguiente comando:
'sudo apt-get install librsvg2-bin
Desktop.Open("/tmp/rellenado.pdf")

End


Enlace de descarga del codigo fuente: alojado en drive google


Fuentes:
Conversión de .svg a .pdf: enlace

sábado, 25 de octubre de 2014

Convertir PDF a EPUB


Convertir PDF a EPUB

He encontrado esta página donde te convierte un pdf a epub, ideal para apuntes o documentos que tengas en formato pdf y lo quieras leer en algún lector epub



Primero tienes que subir el archivo .pdf:

Podemos cambiar algunos datos del archivo de destino.
Y segundo lo convertimos 

Esperamos algunos segundos y se inicia la descarga...
 
y ya lo tenemos, descargado en nuestra carpeta Descarga, la converción del pdf a .epub



EPUB o ePub (acrónimo de la expresión inglesa Electronic publication - Publicación electrónica) es un formato redimensionable de código abierto para leer textos e imágenes. Desde EPUB3 permite también adjuntar audio
PDF (sigla del inglés portable document format, formato de documento portátil) es un formato de almacenamiento de documentos digitales independiente de plataformas de software o hardware. Este formato es de tipo compuesto (imagen vectorialmapa de bits y texto). Fue inicialmente desarrollado por la empresa Adobe Systems, oficialmente lanzado como un estándar abierto el 1 de julio de 2008 y publicado por la Organización Internacional de Estandarización como ISO 32000-1.








sábado, 26 de abril de 2014

TurboPDF: visiona varios pdf o el mismo pdf a la vez en distintas páginas


TurboPDF: visiona varios pdf o el mismo pdf  a la vez en distintas páginas


Se me presentó el otro dia un pequeño problema, tenia un pdf, el cual queria ver dos páginas distintas a la vez, y se me hacia complicado abrir dos ventanas del lector de pdf, porque cada vez que tenía que volver otro dia, con la lectura, tenía que hacer lo mismo, y buscarme las páginas... en fin.... y curiosamente en el foro de gambas presentó Vuott, un código para podeer ver pdf en Gambas... Bien pues le di forma para resolver mi poblema y aqui esta la solución:



Permite:
- Movernos por las páginas del documento.
- Hacer Zoom (menos, más), también responde a la rueda de ratón.
- Tener dos documentos distintos abiertos o el mismo por distintas números de páginas
- La configuración se guarda cuando cerramos el programa, la próxima vez que se inicie, abre los documentos y  se situa en la páginas en que dejaste la lectura .

Enlace descarga: drive google


Fuente:
http://www.gambas-es.org/viewtopic.php?f=1&t=3812&start=0










jueves, 21 de marzo de 2013

futuroscopias: Revista de relatos de ciencia ficción en castellano



Futuroscopias revista de ciencia ficción se encuentra bajo una Licencia
Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported



Futuroscopias es un proyecto literario que nace con dos intenciones manifiestas. La primera es la de ser un laboratorio donde poder descubrir una nueva generación de autores de ciencia ficción española y la segunda es la intención de ofrecer al público una revista con la que volver a maravillarse con historias de un género ingratamente olvidado en este país. También puede considerarse un homenaje a las revistas que hicieron popular el género durante la llamada edad de oro de la ciencia ficción, en los años treinta, cuarenta y cincuenta.
La revista se articula en torno a dos tipos de relatos. El primero será lo que hemos denominado "Visiones" y toma el aspecto de relatos cortos vertebrados alrededor de una idea o un tema común del cual los autores nos ofrecen su interpretación. El segundo es un tipo de relato de extensión muy superior y temática libre donde los autores nos muestran sus ideas, reflexiones y los mundos que han creado.
Actualmente os podeis descargar 3 revistas, en varios formatos: pdf, epub y mobi



miércoles, 9 de enero de 2013

Quitar contraseñas a un pdf

Quitar contraseñas a un pdf

Me dejo este post como nota, para que no se me olvide :)

Tenía en el trabajo un pdf, protegido con contraseña, el cual contenía un texto que me interesaba editar y añadirlo a una hoja de cálculo , pero no me dejaba.

El caso que me han pasado esta dirección web, donde te quitan la contraseña y te lo deja editable el archivo pdf:


http://freemypdf.com/

Pasos:
1) Pulsar en "examinar" para elegir el archivo pdf que quieres "desproteger"
2) Presiona el "do it" (2), para que empiece el proceso...

Al rato se te descarga el archivo ya sin contraseñas.

Lo mejor: Funciona de verdad

Espero que os sea tan útil como a mí.


Saludos




sábado, 22 de diciembre de 2012

LibreOffice: Como Modificar un documento para poderlo leer con facilidad en tu movil o tablet

LibreOffice:

Como Modificar un documento para 

poderlo leer con facilidad

 en tu movil o tablet



Bien este es un pequeño truco que uso para modificar el formato de documentos y asi poderlos leer en un movil.

Cuando voy en autobus, metro o tren, me gusta leer algun libro o apuntes. Tengo un tablet pero es demasiado grande e incomodo para llevar y encima le dura poco la bateria...

¿usar un móvil? Es pequeño yle dura la batería días....el problema me viene es que se ven demasiado pequeña la letra y si uso zoom, tengo que estar desplazando la barra de la pantalla con el dedo para leer la linea entera....un rollazo!! :(

Solución:
Formatear el texto para que el ancho de la pagina sea el ancho de nuestra pantalla

Pasos a seguir:
1º Si tus apuntes o libro estan en pdf, los tienes que convertir en texto.
En linux puedes usar varios programas: (ver enlaces en nota 1)
  • xpdf
$ pdftotext -layout archivo.pdf archivo.odt 
  •  kword


2º Abres el archivo que has convertido (.odt) en el libreoffice.




 Vas al menu "Formato" y luego "Pagina". Aparece un nuevo formulario, vete a la pestaña "Página"



Eliges el formato "Usuario"



Ahora modificamos el Ancho y los Margenes Izquierdo y Derecho:

  1. Ancho:
    Según las dimensiones de la pantalla de tu movil, cambialo. A mi me viene bien dejandolo en 11.60 (realizando alguna prueba, y consiguiras el valor del ancho que te venga mejor)
  2. Margenes Izquierdo y Derecho:
    Lo mejor es dejarlos a cero
Le das al botón "Aplicar", y luego al boton "Aceptar"

El resultado es el siguiente:


3. Ahora solo tenemos que guardarlo en formato .pdf,  (botón "pdf")



 Y ya lo tenemos... ahora solo hay que pasar el documento a la memoria interna o tarjeta SD del movil para que podamos leer nuestros apuntes o libros tranquilamente en los viajes sin dejarnos las pestañas...



Fuentes:
Nota 1:
Como pasar de pdf a odt: http://guisheca.wordpress.com/2007/12/11/pasar-de-pdf-a-odt/
Convertir pdf a txt y viceversa con comandos:
http://travesuras.wordpress.com/2011/11/04/20111104-1/
Nota 2:
Lector gratuito de pdf para android: https://code.google.com/p/apv/downloads/list