SpeakerText, la forma transcribir videos usando Crowdsourcing

0

Uno de los problemas mas grandes en la publicacion de videos, es lo dificil (casi imposible) que resulta para Google, encontrarlos.  A menos que seas muy minucioso e incluyas los tags correctos en el titulo del video, es dificil que Google lo encuentre, y aun con eso, muchos tags valiosos se quedan “ocultos” dentro del video.

speakertext logo contrast

Y eso es lo que hace SpeakerText: devolver una transcripcion de los videos que envias a traves del sitio, para que los robots de Google lean el texto y ayuden a que el video aparezca en los resultados de busqueda.

[youtube=http://www.youtube.com/watch?v=9g-sN0Bd79A&color1=0xb1b1b1&color2=0xd0d0d0&hl=en_US&feature=player_embedded&fs=1]

Segun Erick Schonfeld, de TechCrunch, SpeakerText usa una combinacion de software que transforma la voz en texto, procesamiento de lengua natural y crowdsourcing, para crear cada transcripcion:

Los editores de videos envian los archivos de los que necesitan transcripcion, para que empiece el proceso en una etapa previa, usando Sphinx-4, un software open source que transforma la voz en texto, desarrollado en Carnegie Mellon University.  Los videos, son luego fraccionados en trozos de 5 a 8 segundos, que son distribuidos a transcriptores humanos via Mechanical Turk.

“Los Humanos” corrigen el texto y la puntuacion en una linea de ensamblaje digital, terminando sus mico-tareas rapida y eficientemente.  Diferentes trabajadores son rankeados basandose en su historial de trabajo, lo que ayuda al proceso de asignacion. Los trozos de video transcritos son luego recogidos y re-ensamblados en el video completo, para que un software de reconocimiento de voz alinee el texto del video y agrege marcas de tiempo.  Luego, el software de procesamiento de lengua natural es usado para determinar donde empiezan y terminan las oraciones, y para crear meta tags para mayor beneficios de SEO.

El proceso de ensamblaje completo esta disenado con loops de feedback para mejorarse y ser mas automatizado con el tiempo.  El servicio empieza con un fee de US$20 mensuales para el SpeakerBar, mas US$2 por minuto para las transcripciones. 

El mismo articulo de techcrunch lo usa para demostracion y me parecio una aplicacion realmente util.  Otra cosa interesante es la forma de usar Mechanical Turk.  Aunque existan algunos detractores, es notable como esta herramienta puede ayudar a proyectos y empresas creativas a construir un modelo de negocio. Crowdsourcing tiene tantas ventajas que vino para quedarse, y no solo para el area de tecnologia, sino para cualquier negocio que quiera aprovecharlo.

Cheers,