What is this? From this page you can use the Social Web links to save HTML dentro de los feeds to a social bookmarking site, or the E-mail form to send a link via e-mail.

Social Web

E-mail

E-mail It
November 01, 2004

HTML dentro de los feeds

Posted in: Feedness

Feedness es un proyecto que lanzaremos en apenas unos días y los procesos de desarrollo y diseño han sido interesantes y apenas hemos tenido complicaciones.

En todo momento hemos sido puristas con el código y nuestra idea es poder cumplir con las más estrictas normas de accesibilidad y cumplir con los estándares web.

Ahora bien, Houston, tenemos un problema.

Resulta que cuando se crearon los distintos formatos de sindicación, a alguien le parecio buena idea sindicar no solo el contenido, sino que parte del código HTML también y, bueno, si la gente lo usara correctamente no sería un problema, pero por desgracia, ese no es el caso.

El problema

Actualmente Feedness parsea los feeds de manera que el fichero de salida sea semánticamente correcto, pero el problema surge cuando los feeds que parseamos contienen código no tan correcto:

  • Parrafos, negritas, fonts y otras etiquetas sin cerrar.
  • Imágenes grandes, con width y heigts definidos y alineadas.
  • Selectores CSS, que podrían a llegar a coincidir con los que pudieramos usar nosotros

Estamos intentando diseñar tan defensivamente como sea posible. Intentamos tener en cuenta todos los supuestos, pero hay cosas que sencillamente no se pueden arreglar con buenas hojas de estilo.

Además, por otro lado tenemos sitios que envian un código HTML perfecto y que nos permite mejorar todavía más las posibilidades de presentación, ¿vamos a hacer que paguen justos por pecadores?.

¿Soluciones?

Todavía no hemos encontrado ninguna que nos deje satisfechos:

  • Tolerar el código no correcto, que podría generar anomalías en el diseño.
  • Remover todas las etiquetas HTML del código excepto las imágenes y los enlaces. Perder los headings, las listas y en general el código bien construido. Update: Eduardo me ha sugerido el Sanitize, ¿alguna información al respecto?
  • Pre-procesar todos los contenidos en busca de estas anomalías, convirtiendo Feedness en una herramienta menos ligera con mayores tiempos de carga.

Bloglines recurre al JavaScript, convirtiendo el código de las páginas en un insulto a la accesibilidad y los estándares… pero consigue mostrar todo sin problemas.

Como verán, no hay una solución sencilla y por ahora, creemos que la más razonable es la de tolerar el código no correcto y diseñar MUY defensivamente, pero por probar y preguntar no perdemos nada: ¿Qué harían ustedes?


Return to: HTML dentro de los feeds