Uno de los problemas mas grandes en la publicacion de videos, es lo dificil (casi imposible) que resulta para Google, encontrarlos. A menos que seas muy minucioso e incluyas los tags correctos en el titulo del video, es dificil que Google lo encuentre, y aun con eso, muchos tags valiosos se quedan “ocultos” dentro del video.
Y eso es lo que hace SpeakerText: devolver una transcripcion de los videos que envias a traves del sitio, para que los robots de Google lean el texto y ayuden a que el video aparezca en los resultados de busqueda.
[youtube=http://www.youtube.com/watch?v=9g-sN0Bd79A&color1=0xb1b1b1&color2=0xd0d0d0&hl=en_US&feature=player_embedded&fs=1]
Segun Erick Schonfeld, de TechCrunch, SpeakerText usa una combinacion de software que transforma la voz en texto, procesamiento de lengua natural y crowdsourcing, para crear cada transcripcion:
Los editores de videos envian los archivos de los que necesitan transcripcion, para que empiece el proceso en una etapa previa, usando Sphinx-4, un software open source que transforma la voz en texto, desarrollado en Carnegie Mellon University. Los videos, son luego fraccionados en trozos de 5 a 8 segundos, que son distribuidos a transcriptores humanos via Mechanical Turk.
“Los Humanos” corrigen el texto y la puntuacion en una linea de ensamblaje digital, terminando sus mico-tareas rapida y eficientemente. Diferentes trabajadores son rankeados basandose en su historial de trabajo, lo que ayuda al proceso de asignacion. Los trozos de video transcritos son luego recogidos y re-ensamblados en el video completo, para que un software de reconocimiento de voz alinee el texto del video y agrege marcas de tiempo. Luego, el software de procesamiento de lengua natural es usado para determinar donde empiezan y terminan las oraciones, y para crear meta tags para mayor beneficios de SEO.
El proceso de ensamblaje completo esta disenado con loops de feedback para mejorarse y ser mas automatizado con el tiempo. El servicio empieza con un fee de US$20 mensuales para el SpeakerBar, mas US$2 por minuto para las transcripciones.
El mismo articulo de techcrunch lo usa para demostracion y me parecio una aplicacion realmente util. Otra cosa interesante es la forma de usar Mechanical Turk. Aunque existan algunos detractores, es notable como esta herramienta puede ayudar a proyectos y empresas creativas a construir un modelo de negocio. Crowdsourcing tiene tantas ventajas que vino para quedarse, y no solo para el area de tecnologia, sino para cualquier negocio que quiera aprovecharlo.
Cheers,