White paper · Metodologia editorial
Cómo TubeLens evalúa videos
Existen decenas de métricas para rankear videos de YouTube — casi todas premian la popularidad. TubeLens no usa ninguna de ellas. Cada video recibe tres clasificaciones independientes (el sistema TLR): el Lupómetro (calidad editorial en 4 estados), la Franja Sugerida (5 niveles de idoneidad derivados de 12 señales de contenido) y el Sello Editorial (3 sellos sobre divulgación, fuentes y separación opinión/hecho). Esta página detalla qué observa la IA, cómo pondera y por qué llega al veredicto. Ninguna señal de engagement (vistas, likes, suscriptores) entra. Todo público, auditable, sin caja negra.
Última actualización de esta metodología: mayo de 2026.
Lo que NO entra en la nota
Para ser una alternativa real al algoritmo de YouTube, decidimos qué queda deliberadamente fuera del score.
Señales de engagement excluidas
- Vistas — la popularidad no es calidad.
- Likes y dislikes — métricas manipuladas (bots, brigading; YouTube quitó el dislike público en 2021).
- Número de suscriptores — la autoridad del canal no implica calidad del video individual.
- Comentarios — engagement, no contenido.
- Miniatura y título — pueden engañar; importa lo que el video entrega.
- Watch time — métrica del algoritmo, optimizada para retención, no para calidad.
¿Por qué excluir todo esto?
Estas métricas premian lo que se vuelve viral. La tesis de TubeLens es precisamente que volverse viral no es lo mismo que ser bueno — sensacionalismo, clickbait y rage bait puntúan alto en todas ellas. Contenido educativo profundo de canal pequeño puntúa bajo. Incorporar cualquiera de ellas en la nota nos convertiría en un espejo del algoritmo — perderíamos la razón de existir.
Ley de Goodhart: cuando una medida se vuelve objetivo, deja de ser una buena medida. Si los likes pasaran a formar parte del score, los creadores optimizarían likes — algo que YouTube ya incentiva. No agregaría nada.
Entonces, ¿qué analiza TubeLens?
Solo el contenido — el transcript de lo que se dijo, leído de forma crítica en las 4 dimensiones descritas en la sección 2. Nada más.
1. Pipeline del análisis
Cada análisis pasa por 4 etapas determinísticas. El mismo video procesado hoy y dentro de un mes produce la misma estructura de salida — solo cambia si actualizamos públicamente esta página.
- 1
Extracción de la transcripción
La URL se normaliza y el video se resuelve por su ID de 11 caracteres. La transcripción se obtiene mediante infraestructura propia que extrae subtítulos de cualquier video de YouTube con CC habilitados. Cuando hay subtítulos en varios idiomas priorizamos pt → en → es. No usamos audio ni reconocimiento de voz — solo el texto que el canal dejó disponible como CC.
- 2
Ingeniería de prompt y contrato de salida
La transcripción se envía al modelo dentro de un prompt estricto que define los criterios, los 28 etiquetas posibles, las anclas de puntuación (0/5/10) y la obligación de citar evidencia de la transcripción para cada etiqueta. La salida se restringe con un schema estructurado que rechaza cualquier formato inválido — sin prosa libre, sin campos faltantes.
- 3
Análisis por el modelo
Un modelo de IA generativa de última generación procesa la transcripción con salida controlada: temperatura baja para reducir la variabilidad entre ejecuciones y schema estricto para asegurar una estructura uniforme. El modelo recibe título, canal, idioma de la transcripción y el texto íntegro, truncado a 30.000 caracteres cuando es necesario.
- 4
Postprocesamiento y almacenamiento
La puntuación compuesta se calcula en código (no confiamos en el modelo para sumar números), el sello se asigna por bandas fijas, y todo se guarda en una sola transacción de la base de datos. Los análisis quedan en caché global por video_id.
2. Los 4 criterios de evaluación
Cada video recibe puntuación de 0 a 10 en cuatro dimensiones. Las anclas son fijas y públicas: 0 = ausente, 5 = contenido medio de YouTube, 10 = excepcional. Los pesos definen cómo se combinan en la puntuación final.
Densidad informativa
Peso 30%Cuánto contenido útil hay por minuto. Penaliza repetición, recapitulación excesiva, monólogo introductorio largo, cierre extendido y cualquier recurso para inflar el watch time.
Anclas
0— Casi sin información útil; predomina relleno
5— Algo de relleno, se sigue a 1.25x
10— Cada minuto trae información nueva; recapitulaciones cortas
Claridad
Peso 30%Estructura, didáctica, organización de las ideas. Evalúa si hay un hilo conductor, ejemplos cuando es necesario, definición de términos antes de usarlos, y progresión lógica.
Anclas
0— Caótico, sin estructura, ideas sueltas
5— Se sigue con esfuerzo; estructura implícita
10— Estructura clara, ejemplos en el momento justo, definiciones explícitas
Credibilidad
Peso 30%Fuentes, afirmaciones verificables, ausencia de sensacionalismo. Catastrofismo, certeza absoluta sobre temas controvertidos y charlatanería bajan la nota.
Anclas
0— Afirmaciones sin fuente, sensacionalismo, charlatanería
5— Mezcla hechos y opinión sin distinción clara
10— Bien fundamentado, califica afirmaciones, transparente sobre límites
Originalidad
Peso 10%Análisis propio vs eco del consenso. Penaliza videos que solo reempaquetan lo que ya circula sin agregar análisis, datos propios o perspectiva nueva.
Anclas
0— Repite consenso, sin ángulo propio
5— Recombina información conocida con toque personal
10— Análisis primario, ángulo poco común, investigación propia
3. Puntuación compuesta y sellos
El promedio ponderado de las 4 dimensiones produce un número entre 0 y 10. Ese número se mapea en uno de 5 sellos. Las bandas son fijas; no hay ajuste editorial.
Fórmula
score = densidade × 0.30
+ clareza × 0.30
+ credibil. × 0.30
+ originalid × 0.10Bandas
| Puntuación | Sello | Significado | |
|---|---|---|---|
| 9.0 – 10.0 | Excepcional | Excepcional — referencia en el tema | |
| 7.5 – 8.9 | Recomendado | Recomendado — vale tu tiempo | |
| 6.0 – 7.4 | Aceptable | Aceptable — útil, pero hay mejores | |
| 4.0 – 5.9 | Débil | Débil — probable pérdida de tiempo | |
| 0.0 – 3.9 | Evita | Evitar — desinformación o relleno |
4. Las 28 señales detectadas
Independiente de la puntuación, el modelo busca 28 patrones en el contenido. Cada señal detectada viene con intensidad 1 a 5 y una justificación citando un fragmento de la transcripción como evidencia. Las señales no detectadas se omiten — no hay "respuesta predeterminada".
Señales negativas (red flags)
Señales neutras / descriptivas
Señales positivas (green flags)
5. Categorías primarias
Cada video se categoriza en hasta 3 categorías primarias con confianza 1-5, más una subcategoría libre. Estas alimentan los filtros del ranking y de las páginas de canal.
6. Ranking de canales — promedio Bayesiano
El ranking de canales no usa el promedio simple. Un canal con 2 videos puntuación 10 no puede vencer a un canal con 20 videos puntuación 9.2 — sería estadísticamente injusto. Usamos suavizado Bayesiano con prior en el promedio global del período.
Fórmula
C × M + n × x
score_canal = ─────────────────
C + nParámetros
- M = promedio global de todas las puntuaciones en el período/categoría
- n = número de videos del canal en el período
- x = promedio simple del canal en el período
- C = peso del prior (5)
Regla del umbral 5.0
Canales con puntuación bayesiana superior a 5 entran solo en "mejores". Inferior a 5, solo en "peores". Exactamente 5 queda fuera de ambos.
Mínimo de videos
Canales con menos de 3 videos analizados quedan fuera del ranking — muestra insuficiente para cualquier afirmación estadística.
Los Shorts quedan fuera
Los YouTube Shorts (videos de hasta 60 segundos) no entran en los rankings ni en los promedios agregados de los canales. La rúbrica de 4 dimensiones — densidad, claridad, credibilidad, originalidad — no encaja en contenido de menos de un minuto. Los análisis individuales de Shorts siguen disponibles en la página del análisis; la exclusión aplica solo a los rankings.
7. Limitaciones conocidas
La IA no es infalible y no lo escondemos. Las limitaciones principales son:
- El análisis se basa exclusivamente en la transcripción en texto. No vemos imágenes, gráficos, diapositivas ni lenguaje corporal.
- Sátira sutil sin aviso puede ser mal clasificada como sensacionalista o desinformación.
- No hacemos verificación en vivo contra fuentes externas. La credibilidad se evalúa por consistencia interna, calificación de afirmaciones y citación de fuentes por el propio autor.
- La calidad de la transcripción afecta el resultado. Videos con subtítulos auto-generados de baja calidad tienden a recibir puntuaciones más conservadoras.
- El modelo puede tener sesgo residual en los pesos de etiquetas — auditamos periódicamente y publicamos actualizaciones en esta página.
Contestación y proceso de revisión
Los análisis de TubeLens son opiniones editoriales basadas en una metodología pública. Los dueños de canales pueden cuestionar cualquier sello, nota o señal detectada.
Quién puede cuestionar
Cualquier persona puede reportar un error factual. Los dueños de canales — verificables por su cuenta de YouTube — tienen prioridad en el proceso y derecho a respuesta personalizada.
Qué se puede cuestionar
- Sello final (Excepcional/Recomendado/Aceptable/Débil/Evita).
- Nota compuesta de 0 a 10 o notas individuales de las 4 dimensiones.
- Una señal detectada específica (ej.: clasificado como sensacionalista cuando no lo es).
- Una justificación que cita un fragmento del transcript (error de interpretación).
- Categoría primaria asignada.
Cómo cuestionar
Envía un email a support@inosx.com incluyendo:
- Enlace del análisis cuestionado.
- Ítem específico en disputa (sello, nota, señal, cita).
- Argumento y — si es posible — fragmento del transcript que respalda tu posición.
- Identificación del canal, si eres el dueño.
Plazo y proceso
Respondemos en hasta 5 días hábiles. La revisión la hace una persona, no la IA original. Resultados posibles:
- Re-análisis: el video se procesa de nuevo y el resultado puede cambiar (sube o baja).
- Anotación pública: mantenemos el análisis pero agregamos una nota explicando la contestación y el desenlace.
- Eliminación: raro, reservado para error factual grave o contenido retirado de YouTube. Mantenemos auditoría interna de lo eliminado.
- Mantenimiento con justificación: si la metodología se aplicó correctamente, mantenemos el análisis y respondemos con justificación detallada.
Principios del proceso
- Transparencia: todo desenlace es público (en el propio análisis cuando aplica).
- Sin represalia: cuestionar no degrada al canal, no lo saca del ranking, no cambia análisis futuros más allá del contenido de los nuevos videos.
- Buena fe: asumimos buena fe del contestante. Pedidos repetidos sobre el mismo punto sin argumento nuevo se archivan tras la respuesta inicial.
- Proceso separado del análisis: la IA no revisa contestaciones — siempre es revisión humana, justamente para evitar reforzar los sesgos del modelo.
TLR · TubeLens Editorial Rating
Inspiraciones públicas, clasificación independiente
El TLR — sistema de tres ejes (calidad, franja de edad sugerida, estándar editorial) — fue destilado de principios públicos consolidados: el cuestionario de la International Age Rating Coalition (IARC) para la idoneidad por edad, y los estándares de la Federal Communications Commission (FCC §73.1212) y la Federal Trade Commission (FTC Endorsement Guides) estadounidenses para divulgación de patrocinios y veracidad publicitaria. TubeLens no está afiliado, respaldado ni certificado por ninguna de estas organizaciones. Toda clasificación es editorial, derivada e independiente.
IARC · FCC · FTC
Leituras
La metodología de arriba es nuestra, pero no inventamos los criterios. Son ecos de una tradición editorial y académica — Goodhart, Kahneman, Pariser, Bellingcat. Documentamos las lecturas que sustentan cada decisión metodológica.
Ver bibliografía editorial →