Programa del Curso

Introducción a Multimodal AI

  • Descripción general de la IA multimodal y aplicaciones del mundo real
  • Desafíos en la integración de datos de texto, imagen y audio
  • Investigación y avances de vanguardia

Procesamiento de datos y ingeniería de características

  • Procesamiento de conjuntos de datos de texto, imagen y audio
  • Técnicas de preprocessing para aprendizaje multimodal
  • Estrategias de extracción de características y fusión de datos

Construcción de modelos multimodales con PyTorch y Hugging Face

  • Introducción a PyTorch para aprendizaje multimodal
  • Usando Transformers Hugging Face para tareas de NLP y visión
  • Combinar diferentes modalidades en un modelo de IA unificado

Implementación de fusión de voz, visión y texto

  • Integrando OpenAI Whisper para el reconocimiento de voz
  • Aplicando DeepSeek-Vision para el procesamiento de imágenes
  • Técnicas de fusión para el aprendizaje cruzado-modal

Entrenamiento y optimización de modelos Multimodal AI

  • Estrategias de entrenamiento de modelos para IA multimodal
  • Técnicas de optimización y ajuste de hiperparámetros
  • Abordar el sesgo y mejorar la generalización del modelo

Desplegando Multimodal AI en aplicaciones del mundo real

  • Exportar modelos para uso en producción
  • Implementación de modelos de IA en plataformas en la nube
  • Monitoreo del rendimiento y mantenimiento del modelo

Tópicos avanzados y tendencias futuras

  • Aprendizaje de zero-shot y few-shot en IA multimodal
  • Consideraciones éticas y desarrollo de IA responsable
  • Tendencias emergentes en la investigación de IA multimodal

Resumen y próximos pasos

Requerimientos

  • Fuerte comprensión de los conceptos de aprendizaje automático y aprendizaje profundo
  • Experiencia con frameworks de IA como PyTorch o TensorFlow
  • Familiaridad con el procesamiento de datos de texto, imagen y audio

Público

  • Desarrolladores de IA
  • Ingenieros de aprendizaje automático
  • Investigadores
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas