Cómo TubeLens evalúa videos
Cada análisis sigue un pipeline determinístico con criterios públicos y fórmulas auditables. Esta página explica en detalle qué observa la IA, cómo pondera y por qué llega al veredicto. Nada aquí es una caja negra.
Última actualización de esta metodología: mayo de 2026.
1. Pipeline del análisis
Cada análisis pasa por 4 etapas determinísticas. El mismo video procesado hoy y dentro de un mes produce la misma estructura de salida — solo cambia si actualizamos públicamente esta página.
- 1
Extracción de la transcripción
La URL se normaliza y el video se resuelve por su ID de 11 caracteres. La transcripción se obtiene mediante infraestructura propia que extrae subtítulos de cualquier video de YouTube con CC habilitados. Cuando hay subtítulos en varios idiomas priorizamos pt → en → es. No usamos audio ni reconocimiento de voz — solo el texto que el canal dejó disponible como CC.
- 2
Ingeniería de prompt y contrato de salida
La transcripción se envía al modelo dentro de un prompt estricto que define los criterios, los 28 etiquetas posibles, las anclas de puntuación (0/5/10) y la obligación de citar evidencia de la transcripción para cada etiqueta. La salida se restringe con un schema estructurado que rechaza cualquier formato inválido — sin prosa libre, sin campos faltantes.
- 3
Análisis por el modelo
Un modelo de IA generativa de última generación procesa la transcripción con salida controlada: temperatura baja para reducir la variabilidad entre ejecuciones y schema estricto para asegurar una estructura uniforme. El modelo recibe título, canal, idioma de la transcripción y el texto íntegro, truncado a 30.000 caracteres cuando es necesario.
- 4
Postprocesamiento y almacenamiento
La puntuación compuesta se calcula en código (no confiamos en el modelo para sumar números), el sello se asigna por bandas fijas, y todo se guarda en una sola transacción de la base de datos. Los análisis quedan en caché global por video_id.
2. Los 4 criterios de evaluación
Cada video recibe puntuación de 0 a 10 en cuatro dimensiones. Las anclas son fijas y públicas: 0 = ausente, 5 = contenido medio de YouTube, 10 = excepcional. Los pesos definen cómo se combinan en la puntuación final.
Densidad informativa
Peso 30%Cuánto contenido útil hay por minuto. Penaliza repetición, recapitulación excesiva, monólogo introductorio largo, cierre extendido y cualquier recurso para inflar el watch time.
Anclas
0— Casi sin información útil; predomina relleno
5— Algo de relleno, se sigue a 1.25x
10— Cada minuto trae información nueva; recapitulaciones cortas
Claridad
Peso 25%Estructura, didáctica, organización de las ideas. Evalúa si hay un hilo conductor, ejemplos cuando es necesario, definición de términos antes de usarlos, y progresión lógica.
Anclas
0— Caótico, sin estructura, ideas sueltas
5— Se sigue con esfuerzo; estructura implícita
10— Estructura clara, ejemplos en el momento justo, definiciones explícitas
Credibilidad
Peso 30%Fuentes, afirmaciones verificables, ausencia de sensacionalismo. Catastrofismo, certeza absoluta sobre temas controvertidos y charlatanería bajan la nota.
Anclas
0— Afirmaciones sin fuente, sensacionalismo, charlatanería
5— Mezcla hechos y opinión sin distinción clara
10— Bien fundamentado, califica afirmaciones, transparente sobre límites
Originalidad
Peso 15%Análisis propio vs eco del consenso. Penaliza videos que solo reempaquetan lo que ya circula sin agregar análisis, datos propios o perspectiva nueva.
Anclas
0— Repite consenso, sin ángulo propio
5— Recombina información conocida con toque personal
10— Análisis primario, ángulo poco común, investigación propia
3. Puntuación compuesta y sellos
El promedio ponderado de las 4 dimensiones produce un número entre 0 y 10. Ese número se mapea en uno de 5 sellos. Las bandas son fijas; no hay ajuste editorial.
Fórmula
score = densidade × 0.30
+ clareza × 0.25
+ credibil. × 0.30
+ originalid × 0.15Bandas
| Puntuación | Sello | Significado |
|---|---|---|
| 9.0 – 10.0 | exceptional | Excepcional — referencia en el tema |
| 7.5 – 8.9 | recommended | Recomendado — vale tu tiempo |
| 6.0 – 7.4 | acceptable | Aceptable — útil, pero hay mejores |
| 4.0 – 5.9 | weak | Débil — probable pérdida de tiempo |
| 0.0 – 3.9 | avoid | Evitar — desinformación o relleno |
4. Las 28 señales detectadas
Independiente de la puntuación, el modelo busca 28 patrones en el contenido. Cada señal detectada viene con intensidad 1 a 5 y una justificación citando un fragmento de la transcripción como evidencia. Las señales no detectadas se omiten — no hay "respuesta predeterminada".
Señales negativas (red flags)
Señales neutras / descriptivas
Señales positivas (green flags)
5. Categorías primarias
Cada video se categoriza en hasta 3 categorías primarias con confianza 1-5, más una subcategoría libre. Estas alimentan los filtros del ranking y de las páginas de canal.
6. Ranking de canales — promedio Bayesiano
El ranking de canales no usa el promedio simple. Un canal con 2 videos puntuación 10 no puede vencer a un canal con 20 videos puntuación 9.2 — sería estadísticamente injusto. Usamos suavizado Bayesiano con prior en el promedio global del período.
Fórmula
C × M + n × x
score_canal = ─────────────────
C + nParámetros
- M = promedio global de todas las puntuaciones en el período/categoría
- n = número de videos del canal en el período
- x = promedio simple del canal en el período
- C = peso del prior (5)
Regla del umbral 5.0
Canales con puntuación bayesiana superior a 5 entran solo en "mejores". Inferior a 5, solo en "peores". Exactamente 5 queda fuera de ambos.
Mínimo de videos
Canales con menos de 3 videos analizados quedan fuera del ranking — muestra insuficiente para cualquier afirmación estadística.
7. Limitaciones conocidas
La IA no es infalible y no lo escondemos. Las limitaciones principales son:
- El análisis se basa exclusivamente en la transcripción en texto. No vemos imágenes, gráficos, diapositivas ni lenguaje corporal.
- Sátira sutil sin aviso puede ser mal clasificada como sensacionalista o desinformación.
- No hacemos verificación en vivo contra fuentes externas. La credibilidad se evalúa por consistencia interna, calificación de afirmaciones y citación de fuentes por el propio autor.
- La calidad de la transcripción afecta el resultado. Videos con subtítulos auto-generados de baja calidad tienden a recibir puntuaciones más conservadoras.
- El modelo puede tener sesgo residual en los pesos de etiquetas — auditamos periódicamente y publicamos actualizaciones en esta página.