Reconocimiento de caracteres
- Aclarar una imagen utilizando ImageMagick y convertir a texto con Tesseract
- Realizar captura de pantalla y dividir en partes la captura
- Realizar captura de pantalla, dividir y convertir en texto cada captura
- Detectar si hay un determinado texto en una captura de pantalla
- Detectar y obtener las coordenadas de un texto si aparece en una captura de pantalla
- Hacer clic sobre la zona en la que se ha detectado un texto dentro de una captura de pantalla
- Extraer textos de imágenes con Computer Vision API de Microsoft Azure desde PowerShell
- Extraer datos de una imagen mediante el reconocimiento óptico de caracteres y el análisis de imágenes (Computer Vision API de Microsoft Azure)
- Extraer datos de imágenes que están subidas a un servidor mediante el reconocimiento óptico de caracteres y el análisis de imágenes (Computer Vision API de Microsoft Azure)
Reconocimiento de texto a voz
- Convertir un texto en un fichero WAV
- Leer palabras mediante la voz del Sistema Operativo
- Leer palabras de un fichero y almacenar cada palabra en un fichero de audio mediante la voz del Sistema Operativo
- Leer las noticias de Google News mediante la voz del Sistema Operativo
- Leer las noticias de Google News mediante la voz del Sistema Operativo y almacenarlo en un fichero de audio
- Leer mensajes de correo electrónico de Outlook mediante la voz del Sistema Operativo
Reconocimiento de voz a texto
- Convertir un fichero WAV a texto
- Convertir ficheros de audio a texto
- Convertir la entrada de micrófono a texto
- Convertir voz en texto para comprender la intención del usuario (Bing Speech API)
- Realizar una comunicación enviando preguntas y respondiendo de forma automática mediante el motor de síntesis de voz en PowerShell
- Realizar una comunicación enviando preguntas y respondiendo de forma automática mediante el motor de síntesis de voz en PowerShell (con restricciones para una gramática de reconocimiento de voz)
- Utilizar el motor de síntesis de voz en Powershell para analizar audios con voz comparando los resultados entre gramáticas