Benchmark para Modelos Multimodales (MLLMs)

Sube una imagen, selecciona un modelo y una tarea, y obtén resultados de captioning o VQA.

Seleccionar Modelo
Seleccionar Tarea

Notas

  • para mejroar la velocidad de inferencia, descarga en local y usar GPU avanzada.
  • La métrica BLEU usa una referencia genérica y puede no reflejar la calidad real.
  • Para más detalles, consulta el repositorio del paper.