Dedicado a mis proyectos en Gambas ,un lenguaje de programación parecido al Visual Basic + Java pero ampliamente mejorado y...¡¡para gnu/linux!!.La potencia del gnu/linux sumada a la facilidad del Basic



Consultas, Desarrollo de programas y petición de presupuestos:



Mostrando entradas con la etiqueta texto. Mostrar todas las entradas
Mostrando entradas con la etiqueta texto. Mostrar todas las entradas

sábado, 1 de abril de 2023

Pasar un audio a texto con whisper: instalación y ejemplo de uso

 

Pasar un audio a texto con whisper: instalación y ejemplo de uso



Para instalar:

pip install git+https://github.com/openai/whisper.git 


Para usarlo:

whisper probando.mp3 --model medium --language Spanish


Nota:

1) Siendo el fichero probando.mp3 el fichero de sonido que queremos pasar a texto. La primera vez tardará un poco ya que se tiene que descargar el modelo "medium", pero las siguientes veces ya no lo tiene que descargar y tarda menos.

2) Si no tienes tarjeta gráfica, también funciona con la cpu aunque tarda un poco más. 



Fuente:

https://www.youtube.com/watch?v=UsxxdMfBNkY

miércoles, 24 de noviembre de 2021

ocr a un pdf usando tesseract

 


OCR a un pdf usando tesseract

1º Paso: convertir cada pagina del pdf a png:

Usar el siguiente comando en la terminal, suponiendo que el fichero se llame nombre.pdf:

$pdftoppm -png nombre.pdf  nombre

Creará tantos ficheros .png como páginas haya:

nombre-01.png

nombre-02.png

.....


2º Escanear las paginas generadas (formato .png) usando el idioma español:

$for i in nombre-??.png; do tesseract "$i" "text-$i" -l spa; done;

Y crea tantos ficheros .txt como páginas haya.


3º Unimos todos los ficheros txt que ha generado:

$cat text-nombre* > unidos.txt


Finalmente en el fichero "unidos.txt" estará todo el texto que haya podido extraer del pdf.

Ahora nos toca revisarlo :)


Fuente:

https://www.howtogeek.com/682389/how-to-do-ocr-from-the-linux-command-line-using-tesseract/


OTRA FORMA:

find ./ -name "*.jpg" | sort | while read file; do tesseract "$file" "`basename "$file" | sed 's/\.[[:alnum:]]*$//'`.txt" -l spa -psm 3; done



martes, 14 de abril de 2020

Modificación de PDF: buscar y reemplazar texto internamente en un fichero PDF

Modificación del contenido de un PDF: buscar y reemplazar texto internamente en un fichero PDF


Os dejo una pequeña aplicación para cambiar el contenido de texto de un fichero de .pdf



Características:
- Puede hacer hasta 5 buscar/reemplazar, a la vez, en el fichero
- Indica si se han realizado los reemplazos (iconito de ok o cancel)
- Le he añadido un sistema de "perfiles" parar guardar la información que tiene que buscar y reemplazar.

A mi me es útil, porque suelo hacer muchos cambios en varios ficheros  



Instalador .deb y codigo fuente:
https://drive.google.com/drive/folders/1IjVcFB-Q3Po6exZPDrY0goYWcD6ptTVt?usp=sharing

Fuente:
https://www.gambas-es.org/viewtopic.php?f=5&p=47904#p47904


Video tutorial de ejemplo de uso:


jueves, 28 de diciembre de 2017

PintaScreen Plus: Nueva Versión

PintaScreen Plus: Nueva Versión

version 0.75

A esta nueva versión se han incluido dos mejoras interesantes:
1) Ahora la herramienta de texto admite que podamos poner texto enriquecido, osea podemos poner etiquetas del tipo <b> para poner una palabra en negrita o con la etiqueta <br> introducir un retorno de carro, para poder poner el texto en varias lineas. Os adjunto las etiquetas que admite:


<p> <br> <a> <font> <b> <i> <s> <sub> <sup> <small> <tt> <u>
<h1> <h2> <h3> <h4> <h5> <h6>


Para mas información sobre RichText que admite gambas:
http://gambaswiki.org/wiki/def/richtext

Ejemplo de uso de etiquetas de texto enriquecido



2) La segunda mejora, nos sirve para poner una imagen de fondo con diversas formas de escalarla:
Podemos:
- escalar la imagen para que se ajuste a las dimensiones de la pantalla
- poner la imagen sin ajustar, osea con la dimensiones que tendría (queda centrada en la pantalla, con un fondo gris)
- Adaptar la imagen verticalmente, escalando para que su alto coincida con el alto de la pantalla
- Adaptar la imagen horizontalmente, escalando la imagen para que su ancho coincida con el ancho de la pantalla.





Nota:
El plus no quiere decir que haya que pagar por conseguir esta nueva versión, solo es que se ha usado gambas3.10 para programarla. 

Os dejo un video de ejemplo de uso.