Cerrar
CONACYT

Doctorado en Ciencias en Ciencia de Datos

En INFOTEC, hemos creado el programa de Doctorado en Ciencias en Ciencia de Datos para egresados que tengan interés en la investigación y generación de soluciones a problemas de alto impacto. ¡Conócelo!


Presentación

La importancia de la información y los datos como ciencia se debe a que cada vez más existen grandes cúmulos de información y se hace necesario formar expertos que analicen, experimenten, exploren y combinen los datos para comprenderlos y encontrar posibilidades diversas de explicación, aplicación y uso de la información. Tener acceso a información a gran escala tiene la ventaja de permitir cruzarla para analizarla pero no basta con organizar los datos sino estructurarlos para acceder a ellos de manera fácil, rápida y confiable.

INFOTEC desarrolla un proyecto de investigación denominado “Analítica Computacional de Grandes Cúmulos de Información (Big Data)” ello le ha permitido agrupar a un grupo interdisciplinario de investigadores para desarrollar tareas encaminadas a la creación de un laboratorio de Big Data. Así mismo, es responsable del Laboratorio Nacional de Internet del Futuro, que aborda temáticas relacionadas con el cómputo en la nube y las tecnologías de Big Data.

Se tiene conocimiento de la cada vez mayor demanda de científicos de datos en el país, lo que hace necesario darle atención al tema y es el punto de partida para la creación de posgrados a nivel maestría y doctorado en Información y Ciencia de Datos.

La experiencia en el diseño curricular de programas de posgrado y su operación en el marco del Programa Nacional de Posgrados de Calidad, que junto con un grupo de académicos internos y externos expertos en diseño curricular y el desarrollo de planes y programas de estudio en colaboración con científicos especializados en la materia, acompañados de instituciones educativas y otros centros de investigación, hacen posible el desarrollo de una propuesta académica sólida.

Para garantizar la calidad de un Programa de posgrado INFOTEC puso especial énfasis para que desde su diseño se tomaran en cuenta las necesidades de la sociedad, de la profesión, del campo de conocimiento y del empleo. Gracias a ello, los planes de estudio en Ciencia de Datos consta de cuatro fases:

  1. Análisis del contexto y de la necesidad de formación del perfil profesional, realizado mediante el análisis de los principales factores científico-tecnológicos asociados a la creación del puesto; así como la exploración de la oferta educativa existente. Esta fase será desarrollada por el personal de INFOTEC.
  2. Identificación de las competencias y perfil del profesionista, resultado de la investigación documental del personal de INFOTEC.
  3. Construcción del perfil de egreso, mediante la consulta con especialistas de la academia y la industria siguiendo el enfoque funcional de construcción de un perfil de referencia para una especialidad.
  4. Elaboración de la estructura curricular, realizado en forma colegiada entre el personal de INFOTEC, los empleadores y la academia para la derivación de las unidades de competencia tanto de las genéricas como de las profesionales; identificación y selección de saberes correspondientes a las competencias a desarrollar; definición de los cursos y construcción de los trayectos formativos y de la malla curricular.

 

Modalidad: Tiempo completo.

Sedes: Ciudad de México y Aguascalientes.

Costo total del programa: $500,000.00 (QUINIENTOS MIL PESOS 00/100 M.N.)
Para mayor información acerca de becas, escríbenos a unidaddeposgrados@infotec.mx

DCD

Perfil de ingreso

El Doctorado en Ciencias en Ciencia de datos con orientación a la investigación, está dirigida a estudiantes que pueden dedicar tiempo completo a los estudios.

  • Egresados de maestría con interés en la investigación y generación de aplicaciones de alto nivel en Ciencia de datos: Maestrías en Ciencias Física, Matemáticas, Químicas y afines, Ciencia de datos, Ingenierías, Computación, Economía, Finanzas, entre otras.

Requisitos de ingreso

  • Acta de nacimiento o naturalización, en su caso.
  • Permiso de migración en caso de extranjeros.
  • Título de Maestría de área afín
  • Acta de examen de grado
  • Cédula profesional (o constancia de estar en trámite)
  • Certificado de estudios con promedio de 8.0 (ocho punto cero) o equivalente
  • Carta exposición de motivos en la que fundamentes tu interés por cursar el Doctorado. (entre 2 y 3 cuartillas).
  • Constancia original que certifique el dominio del idioma inglés (TOEFFL: PBT 500, CBT: 173, iBT 61 o equivalente en IELTS)
  • Dos cartas de recomendación académicas y/o laborales, en hoja membretada y dirigidas al Comité Académico de INFOTEC
  • Currículum Vitae
  • Portada de Tesis o trabajo de maestría
  • En su caso, presentar carátula de publicaciones e incluir hoja legal conteniendo ISBN o ISSN, y primera página de la publicación donde aparezca el título y su nombre (o bien la portada con resumen de su trabajo en caso de haber participado en un foro académico o empresarial (requisito deseable, mas no indispensable).

Perfil de egreso

Generar conocimientos de frontera en campos afines a la Ciencia de datos e información, relevantes para la solución a problemas de alto impacto vinculados con los sectores productivos, públicos y privados.

  1. Identificar problemáticas de frontera en el manejo de grandes volúmenes de datos.
  2. Analizar las problemáticas en la extracción de datos.
  3. Investigar nuevas metodologías para el pre procesamiento y representación de datos.
  4. Proponer modelos alternativos para la representación de datos.
  5. Desarrollar herramientas de análisis, técnicas, algoritmos y modelos originales (matemáticos y/o de inteligencia artificial) para el análisis de datos masivos, estructurados y no estructurados.
  6. Desarrollar técnicas novedosas de visualización de datos e información.
  7. Transferir, adaptar y aplicar los métodos de análisis y modelos, técnicas y algoritmos desarrollados a diferentes dominios y ámbitos de las organizaciones sociales, gubernamentales y empresariales.
  8. Liderar proyectos de investigación, individuales y colectivos, en el análisis y manejo de datos a gran escala, con un enfoque interdisciplinar.
  9. Definir líneas y proyectos de investigación para dar respuesta a las problemáticas de frontera en el manejo de datos masivos, y sus implicaciones éticas y de protección de datos personales.
  10. Comunicar los resultados de su investigación en publicaciones científicas y foros académicos relevantes para el público especializado en Ciencia de datos y especialidades afines.
  11. Formar a otros especialistas de alto nivel en el área de Ciencia de datos y ciencias afines con enfoque interdisciplinar.

Plan de estudios

En función del perfil de cada estudiante, su tutor hará sugerencias sobre los cursos que forman parte del posgrado, lo que permitirá una mejor nivelación y/o reforzamiento de sus conocimientos.

También podrán ser cursos de cualquier otra institución de educación superior siempre que su programa de posgrado se encuentre en el PNPC. En todos los casos no tendrá valor curricular.

Mapa curricular

Semestre 1 Semestre 2 Semestre 3 Semestre 4 Semestre 5 Semestre 6 Semestre 7 Semestre 8
Proyecto Investigación 1 Proyecto Investigación 2 Proyecto Investigación 3 Proyecto Investigación 4 Proyecto Investigación 5 Proyecto Investigación 6 Seminario de Tesis 1 Seminario de Tesis 2
Seminario Investigación 1 Seminario Investigación 2 Seminario Investigación 3 Seminario Investigación 4 Seminario Investigación 5 Seminario Investigación 6

En los últimos dos semestres terminará y sustentará su proyecto de investigación.

  • Optativa de Ciencia de datos a profundidad.
  • Seminario de tesis. Metodología y presentación de avances entre los tesistas del doctorado.

Proyecto de investigación. Trabajo de investigación del estudiante con el acompañamiento de su director. El estudiante desarrolla la investigación para un proyecto de interés propio.

Admisión

Proceso de Admisión

Posterior al envío de la solicitud de admisión y de cumplir los requisitos de admisión, el proceso de admisión se llevará acabo con las tres etapas siguientes:

  • Primera Etapa: Presentar propuesta de proyecto de investigación
  • Segunda Etapa: Entrevista presencial con la Comisión de Admisión
  • Tercera Etapa: Entrevista de aspirantes pre- seleccionados con Directivos del INFOTEC
ACTIVIDADES FECHAS
Vigencia de la convocatoria 28 de febrero al 10 de junio de 2017
Envío de solicitud de admisión y documentación 01 de abril al 10 de junio de 2017
Elaboración de propuesta de proyecto de investigación 10 de junio al 14 de julio de 2017
Entrevistas con investigadores 10 de junio al 14 de julio de 2017
Evaluación de proyectos (Comité Académico) 17 al 21 de julio de 2017
Entrevistas presenciales con la comisión de admisión y directivos 25 al 27 de julio de 2017
Dictamen de admisión 08 al 14 de agosto de 2017
Inscripciones 14 al 18 de agosto de 2017
Inicio del posgrado 19 de septiembre de 2017

¡Inicia la primera etapa! Presenta tu propuesta.

Deberás presentar una propuesta de proyecto de investigación conforme a los lineamientos de investigación (descarga el pdf aquí) y acorde a cualquiera de las cuatro Líneas de Generación y Aplicación del Conocimiento (LGAC) asociadas a la temática del programa y a las áreas de investigación al doctorado.

  • Inteligencia computacional en la ciencia de datos
  • Analítica de grandes cúmulos de información
  • Combinatoria, modelado y análisis de algoritmos

Para obtener asesoría en la elaboración de tu propuesta de proyecto de investigación, es indispensable que hagas contacto con al menos uno de los investigadores especialistas en las LGAC. El primer contacto será a través del correo electrónico del investigador de tu elección y con copia a unidaddeposgrados@infotec.mx

Ponte en contacto con los investigadores para realizar la primera etapa de tu admisión. Consulta sus perfiles:

Productos académicos

En el posgrado de Ciencia de Datos se cuenta con cuatro Líneas de Generación y Aplicación del Conocimiento (LAGC) asociadas a la temática del programa y a las áreas de investigación asociadas a la Ciencia de Datos.

  • Inteligencia computacional en la ciencia de datos
  • Analítica de grandes cúmulos de información
  • Combinatoria, modelado y análisis de algoritmos
  • Cómputo de alto rendimiento

Inteligencia computacional en la Ciencia de Datos.

La inteligencia computacional es una rama del área de inteligencia artificial que se encarga del desarrollo de métodos que exhiben un comportamiento inteligente. En particular, desde la perspectiva de ciencia de datos, los métodos son aplicados al análisis de datos masivos con los objetivos de emular las acciones realizadas por un experto, aprender y descubrir patrones que no son evidentes mediante un análisis manual.

Esta línea tiene como objetivo aplicar, desarrollar y proponer técnicas de inteligencia computacional aplicadas en la Ciencia de Datos para resolver tareas como: clasificación, regresión, agrupación de elementos similares, modelización automática de problemas basados en ejemplos, etc. Estas tareas se resuelven mediante la aplicación de campos tales como: cómputo evolutivo, procesamiento del lenguaje natural, reconocimiento de patrones, visión artificial, redes neuronales artificiales, sistemas expertos, aprendizaje computacional y extracción de conocimiento.

Analítica de grandes cúmulos de información

La Analítica de Grandes Cúmulos de Información (Big Data Analytics) implica nuevas capacidades en el uso estratégico del análisis de datos. Producto del desarrollo tecnológico acelerado de las TIC, la generación masiva de datos y el proceso de apropiamiento tecnológico de las organizaciones hacen plausible la generación de valor mediante el procesamiento de grandes volúmenes de información (datos estructurados, no estructurados o semiestructurados).

El enfoque de esta línea se centra en los métodos analíticos para la generación de información valiosa (valor agregado) que de manera oportuna asistan a la toma de decisiones. Muchos de los métodos analíticos de grandes cúmulos de información involucran la aplicación de técnicas de la inteligencia computacional para la realización de tareas, que no serían posibles realizar con el enfoque tradicional de bases de datos relacionales y análisis estadístico multivariado. Las técnicas de ciencia de datos utilizadas para este fin son: análisis exploratorio de datos, análisis topológico de datos, minería de textos, minería de datos, minería de opinión, aprendizaje computacional, visualización de datos e información, recuperación de información, análisis estadístico, análisis geoespacial y análisis espacio-temporal.

Combinatoria, modelado y análisis de algoritmos

El estudio de los problemas básicos en un área del conocimiento es vital para la fundamentación y el cultivo mismo del área del conocimiento. La combinatoria es una rama de las matemáticas discretas que estudia la enumeración, construcción y existencia de estructuras discretas que satisfacen ciertas condiciones establecidas. En su ámbito de estudio se encuentra la agrupación, los órdenes, el conteo, y la construcción de configuraciones, entre otras; las cuales son herramientas matemáticas fundamentales para la construcción y el análisis de algoritmos que sean a su vez eficaces y eficientes para el análisis de grandes cúmulos de información. Como tal la interacción entre la combinatoria y la construcción y análisis de algoritmos es un proceso simbiótico y cíclico inseparable.

El análisis de algoritmos se encarga del estudio de la factibilidad de un algoritmo para resolver una tarea dada. De manera más detallada, la factibilidad viene dada por la determinación de los costos computacionales de la ejecución de un algoritmo, tanto en tiempo de cómputo como la memoria necesaria en función de la entrada. Diseñar algoritmos para el manejo de grandes cantidades de datos en una arquitectura de cómputo con limitaciones físicas reales es una tarea ardua que requiere una estrecha articulación entre el análisis teórico y la experimentación. Esta línea tiene el propósito de generar conocimiento en ciencia básica y de frontera en las áreas relacionadas a: Algoritmos aproximados, modelado de sistemas, aplicaciones de teoría de gráficas y sus generalizaciones, tal como la topología combinatoria.

Cómputo de alto rendimiento

En los últimos años, los equipos de cómputo de universidades y empresas han sido renovados con el propósito de contar con una infraestructura adecuada para el tratamiento de BigData. Este tipo de súper computadoras, necesarias para el procesamiento eficiente de grandes cúmulos de información en el área de Ciencia de Datos, son pocas veces utilizadas a su máxima capacidad debido a la falta de capital humano de alta calidad especializado en el desarrollo, análisis e implementación de algoritmos paralelizables que aprovechen al máximo las capacidades de este tipo de dispositivos considerando también su correcta configuración y administración.

El cómputo de alto rendimiento es una herramienta para la solución de problemas que requieren una gran cantidad de recursos computacionales. Con este fin, se enfoca en el uso eficiente de arquitecturas de cómputo paralelas y distribuidas; esto incluye, en diseñar algoritmos específicamente para dichas arquitecturas así como el estudio de las arquitecturas en sí mismas. Los temas pertinentes a esta línea son: cómputo paralelo y distribuido, arquitecturas de alto rendimiento, algoritmos distribuidos, lenguajes de programación y sistemas operativos. arquitecturas de alto rendimiento, algoritmos distribuidos, lenguajes de programación y sistemas operativos.

Datos de contacto:

Dirección Adjunta de Innovación y Conocimiento | Gerencia de Capital Humano | Mtra. Patricia Ávila Muñoz
Escríbenos a: unidaddeposgrados@infotec.mx
Ing. Guillermo Morales | Tel: (55) 5624-2800 ext. 6138

o a través de nuestras redes sociales:
Facebook: PosgradosINFOTEC | Twitter: @posgradoInfotec | Youtube: Upinfotec