White paper · Metodologia editorial

Cómo TubeLens evalúa videos

Q: Lo que NO entra en la nota

TubeLens no usa vistas, likes, dislikes, suscriptores, comentarios, miniatura, título ni watch time en el cálculo de la nota. Solo se evalúa el contenido del transcript, con lectura crítica en las 4 dimensiones. Las métricas de engagement premian lo que se vuelve viral — y volverse viral no es lo mismo que ser bueno.

Q: Contestación y proceso de revisión

Los dueños de canales pueden cuestionar cualquier análisis enviando un email a support@inosx.com con el enlace del análisis + qué se está cuestionando + (opcional) fragmento del transcript que respalde la contestación. Respuesta en hasta 5 días hábiles. Resultados posibles: re-análisis, anotación pública, eliminación del análisis o mantenimiento con justificación adicional.

Existen decenas de métricas para rankear videos de YouTube — casi todas premian la popularidad. TubeLens no usa ninguna de ellas. Cada video recibe tres clasificaciones independientes (el sistema TLR): el Lupómetro (calidad editorial en 4 estados), la Franja Sugerida (5 niveles de idoneidad derivados de 12 señales de contenido) y el Sello Editorial (3 sellos sobre divulgación, fuentes y separación opinión/hecho). Esta página detalla qué observa la IA, cómo pondera y por qué llega al veredicto. Ninguna señal de engagement (vistas, likes, suscriptores) entra. Todo público, auditable, sin caja negra.

Última actualización de esta metodología: mayo de 2026.

Lo que NO entra en la nota

Para ser una alternativa real al algoritmo de YouTube, decidimos qué queda deliberadamente fuera del score.

Señales de engagement excluidas

Vistas — la popularidad no es calidad.
Likes y dislikes — métricas manipuladas (bots, brigading; YouTube quitó el dislike público en 2021).
Número de suscriptores — la autoridad del canal no implica calidad del video individual.
Comentarios — engagement, no contenido.
Miniatura y título — pueden engañar; importa lo que el video entrega.
Watch time — métrica del algoritmo, optimizada para retención, no para calidad.

¿Por qué excluir todo esto?

Estas métricas premian lo que se vuelve viral. La tesis de TubeLens es precisamente que volverse viral no es lo mismo que ser bueno — sensacionalismo, clickbait y rage bait puntúan alto en todas ellas. Contenido educativo profundo de canal pequeño puntúa bajo. Incorporar cualquiera de ellas en la nota nos convertiría en un espejo del algoritmo — perderíamos la razón de existir.

Ley de Goodhart: cuando una medida se vuelve objetivo, deja de ser una buena medida. Si los likes pasaran a formar parte del score, los creadores optimizarían likes — algo que YouTube ya incentiva. No agregaría nada.

Entonces, ¿qué analiza TubeLens?

Solo el contenido — el transcript de lo que se dijo, leído de forma crítica en las 4 dimensiones descritas en la sección 2. Nada más.

1. Pipeline del análisis

Cada análisis pasa por 4 etapas determinísticas. El mismo video procesado hoy y dentro de un mes produce la misma estructura de salida — solo cambia si actualizamos públicamente esta página.

1
Extracción de la transcripción
La URL se normaliza y el video se resuelve por su ID de 11 caracteres. La transcripción se obtiene mediante infraestructura propia que extrae subtítulos de cualquier video de YouTube con CC habilitados. Cuando hay subtítulos en varios idiomas priorizamos pt → en → es. No usamos audio ni reconocimiento de voz — solo el texto que el canal dejó disponible como CC.
2
Ingeniería de prompt y contrato de salida
La transcripción se envía al modelo dentro de un prompt estricto que define los criterios, los 28 etiquetas posibles, las anclas de puntuación (0/5/10) y la obligación de citar evidencia de la transcripción para cada etiqueta. La salida se restringe con un schema estructurado que rechaza cualquier formato inválido — sin prosa libre, sin campos faltantes.
3
Análisis por el modelo
Un modelo de IA generativa de última generación procesa la transcripción con salida controlada: temperatura baja para reducir la variabilidad entre ejecuciones y schema estricto para asegurar una estructura uniforme. El modelo recibe título, canal, idioma de la transcripción y el texto íntegro, truncado a 30.000 caracteres cuando es necesario.
4
Postprocesamiento y almacenamiento
La puntuación compuesta se calcula en código (no confiamos en el modelo para sumar números), el sello se asigna por bandas fijas, y todo se guarda en una sola transacción de la base de datos. Los análisis quedan en caché global por video_id.

2. Los 4 criterios de evaluación

Cada video recibe puntuación de 0 a 10 en cuatro dimensiones. Las anclas son fijas y públicas: 0 = ausente, 5 = contenido medio de YouTube, 10 = excepcional. Los pesos definen cómo se combinan en la puntuación final.

Densidad informativa

Peso 30%

Cuánto contenido útil hay por minuto. Penaliza repetición, recapitulación excesiva, monólogo introductorio largo, cierre extendido y cualquier recurso para inflar el watch time.

Anclas

0— Casi sin información útil; predomina relleno

5— Algo de relleno, se sigue a 1.25x

10— Cada minuto trae información nueva; recapitulaciones cortas

Claridad

Peso 30%

Estructura, didáctica, organización de las ideas. Evalúa si hay un hilo conductor, ejemplos cuando es necesario, definición de términos antes de usarlos, y progresión lógica.

Anclas

0— Caótico, sin estructura, ideas sueltas

5— Se sigue con esfuerzo; estructura implícita

10— Estructura clara, ejemplos en el momento justo, definiciones explícitas

Credibilidad

Peso 30%

Fuentes, afirmaciones verificables, ausencia de sensacionalismo. Catastrofismo, certeza absoluta sobre temas controvertidos y charlatanería bajan la nota.

Anclas

0— Afirmaciones sin fuente, sensacionalismo, charlatanería

5— Mezcla hechos y opinión sin distinción clara

10— Bien fundamentado, califica afirmaciones, transparente sobre límites

Originalidad

Peso 10%

Análisis propio vs eco del consenso. Penaliza videos que solo reempaquetan lo que ya circula sin agregar análisis, datos propios o perspectiva nueva.

Anclas

0— Repite consenso, sin ángulo propio

5— Recombina información conocida con toque personal

10— Análisis primario, ángulo poco común, investigación propia

3. Puntuación compuesta y sellos

El promedio ponderado de las 4 dimensiones produce un número entre 0 y 10. Ese número se mapea en uno de 5 sellos. Las bandas son fijas; no hay ajuste editorial.

Fórmula

score = densidade × 0.30
      + clareza    × 0.30
      + credibil.  × 0.30
      + originalid × 0.10

Bandas

Puntuación	Sello	Significado
9.0 – 10.0	Excepcional	Excepcional — referencia en el tema
7.5 – 8.9	Recomendado	Recomendado — vale tu tiempo
6.0 – 7.4	Aceptable	Aceptable — útil, pero hay mejores
4.0 – 5.9	Débil	Débil — probable pérdida de tiempo
0.0 – 3.9	Evita	Evitar — desinformación o relleno

4. Las 28 señales detectadas

Independiente de la puntuación, el modelo busca 28 patrones en el contenido. Cada señal detectada viene con intensidad 1 a 5 y una justificación citando un fragmento de la transcripción como evidencia. Las señales no detectadas se omiten — no hay "respuesta predeterminada".

Señales negativas (red flags)

PseudocientíficoTeórico de la conspiraciónSensacionalistaClickbaitAlarmistaDesinformaciónPublicidad encubiertaCharlataneríaFanboy/haterDoomscroll baitDogmáticoRage baitDiscriminatorioPolarizadorRelleno/repetitivo

Señales neutras / descriptivas

OpiniónPromocional (declarado)EspeculativoSátiraStorytelling personalPolémico

Señales positivas (green flags)

Bien-fundamentadoEquilibradoDidácticoOriginalTransparenteRigurosoProfundoActualizado

5. Categorías primarias

Cada video se categoriza en hasta 3 categorías primarias con confianza 1-5, más una subcategoría libre. Estas alimentan los filtros del ranking y de las páginas de canal.

EducaciónTecnologíaNegociosEntretenimientoNoticias y PolíticaSalud y BienestarCienciaEstilo de vidaDeportesCulturaContenido cuestionable

6. Ranking de canales — promedio Bayesiano

El ranking de canales no usa el promedio simple. Un canal con 2 videos puntuación 10 no puede vencer a un canal con 20 videos puntuación 9.2 — sería estadísticamente injusto. Usamos suavizado Bayesiano con prior en el promedio global del período.

Fórmula

              C × M  +  n × x
score_canal = ─────────────────
                 C  +  n

Parámetros

M = promedio global de todas las puntuaciones en el período/categoría
n = número de videos del canal en el período
x = promedio simple del canal en el período
C = peso del prior (5)

Regla del umbral 5.0

Canales con puntuación bayesiana superior a 5 entran solo en "mejores". Inferior a 5, solo en "peores". Exactamente 5 queda fuera de ambos.

Mínimo de videos

Canales con menos de 3 videos analizados quedan fuera del ranking — muestra insuficiente para cualquier afirmación estadística.

Los Shorts quedan fuera

Los YouTube Shorts (videos de hasta 60 segundos) no entran en los rankings ni en los promedios agregados de los canales. La rúbrica de 4 dimensiones — densidad, claridad, credibilidad, originalidad — no encaja en contenido de menos de un minuto. Los análisis individuales de Shorts siguen disponibles en la página del análisis; la exclusión aplica solo a los rankings.

7. Limitaciones conocidas

La IA no es infalible y no lo escondemos. Las limitaciones principales son:

El análisis se basa exclusivamente en la transcripción en texto. No vemos imágenes, gráficos, diapositivas ni lenguaje corporal.
Sátira sutil sin aviso puede ser mal clasificada como sensacionalista o desinformación.
No hacemos verificación en vivo contra fuentes externas. La credibilidad se evalúa por consistencia interna, calificación de afirmaciones y citación de fuentes por el propio autor.
La calidad de la transcripción afecta el resultado. Videos con subtítulos auto-generados de baja calidad tienden a recibir puntuaciones más conservadoras.
El modelo puede tener sesgo residual en los pesos de etiquetas — auditamos periódicamente y publicamos actualizaciones en esta página.

Contestación y proceso de revisión

Los análisis de TubeLens son opiniones editoriales basadas en una metodología pública. Los dueños de canales pueden cuestionar cualquier sello, nota o señal detectada.

Quién puede cuestionar

Cualquier persona puede reportar un error factual. Los dueños de canales — verificables por su cuenta de YouTube — tienen prioridad en el proceso y derecho a respuesta personalizada.

Qué se puede cuestionar

Sello final (Excepcional/Recomendado/Aceptable/Débil/Evita).
Nota compuesta de 0 a 10 o notas individuales de las 4 dimensiones.
Una señal detectada específica (ej.: clasificado como sensacionalista cuando no lo es).
Una justificación que cita un fragmento del transcript (error de interpretación).
Categoría primaria asignada.

Cómo cuestionar

Envía un email a support@inosx.com incluyendo:

Enlace del análisis cuestionado.
Ítem específico en disputa (sello, nota, señal, cita).
Argumento y — si es posible — fragmento del transcript que respalda tu posición.
Identificación del canal, si eres el dueño.

Plazo y proceso

Respondemos en hasta 5 días hábiles. La revisión la hace una persona, no la IA original. Resultados posibles:

Re-análisis: el video se procesa de nuevo y el resultado puede cambiar (sube o baja).
Anotación pública: mantenemos el análisis pero agregamos una nota explicando la contestación y el desenlace.
Eliminación: raro, reservado para error factual grave o contenido retirado de YouTube. Mantenemos auditoría interna de lo eliminado.
Mantenimiento con justificación: si la metodología se aplicó correctamente, mantenemos el análisis y respondemos con justificación detallada.

Principios del proceso

Transparencia: todo desenlace es público (en el propio análisis cuando aplica).
Sin represalia: cuestionar no degrada al canal, no lo saca del ranking, no cambia análisis futuros más allá del contenido de los nuevos videos.
Buena fe: asumimos buena fe del contestante. Pedidos repetidos sobre el mismo punto sin argumento nuevo se archivan tras la respuesta inicial.
Proceso separado del análisis: la IA no revisa contestaciones — siempre es revisión humana, justamente para evitar reforzar los sesgos del modelo.

support@inosx.com

TLR · TubeLens Editorial Rating

Inspiraciones públicas, clasificación independiente

El TLR — sistema de tres ejes (calidad, franja de edad sugerida, estándar editorial) — fue destilado de principios públicos consolidados: el cuestionario de la International Age Rating Coalition (IARC) para la idoneidad por edad, y los estándares de la Federal Communications Commission (FCC §73.1212) y la Federal Trade Commission (FTC Endorsement Guides) estadounidenses para divulgación de patrocinios y veracidad publicitaria. TubeLens no está afiliado, respaldado ni certificado por ninguna de estas organizaciones. Toda clasificación es editorial, derivada e independiente.

IARC · FCC · FTC

Leituras

La metodología de arriba es nuestra, pero no inventamos los criterios. Son ecos de una tradición editorial y académica — Goodhart, Kahneman, Pariser, Bellingcat. Documentamos las lecturas que sustentan cada decisión metodológica.

Ver bibliografía editorial →

Lo que NO entra en la nota

Señales de engagement excluidas

¿Por qué excluir todo esto?

Entonces, ¿qué analiza TubeLens?

1. Pipeline del análisis

Extracción de la transcripción

Ingeniería de prompt y contrato de salida

Análisis por el modelo

Postprocesamiento y almacenamiento

2. Los 4 criterios de evaluación

Densidad informativa

Claridad

Credibilidad

Originalidad

3. Puntuación compuesta y sellos

4. Las 28 señales detectadas

Señales negativas (red flags)

Señales neutras / descriptivas

Señales positivas (green flags)

5. Categorías primarias

6. Ranking de canales — promedio Bayesiano

Regla del umbral 5.0

Mínimo de videos

Los Shorts quedan fuera

7. Limitaciones conocidas

Contestación y proceso de revisión

Quién puede cuestionar

Qué se puede cuestionar

Cómo cuestionar

Plazo y proceso

Principios del proceso

Inspiraciones públicas, clasificación independiente