Algunos recursos para aprender sobre Ciencia de Datos

A mediados de este mes, tendré el honor de impartir el curso “Data Analytics II” dentro del programa Global MBA de Incae. Este curso tiene como objetivo familiarizar a los estudiantes con el apasionante campo del aprendizaje automático, tanto supervisado como no supervisado, y explorar sus variadas aplicaciones en el ámbito empresarial. Como una iniciativa en línea con este enfoque introductorio, me gustaría compartir con ustedes algunos recursos valiosos que les permitirán sumergirse de lleno en este fascinante universo de datos.

Para facilitar la comprensión, he decidido organizar estas recomendaciones en categorías que van desde las más gerenciales a las más técnicas / aplicadas.

¡Espero las encuentren útiles!


Libros de Enfoque Gerencial y Conceptual:

En esta categoría agrupo libros que se centran en la gestión y los conceptos en lugar de los algoritmos y modelos. Son buenos libros para iniciar este recorrido. El primero es 100% gerencial mientras que el segundo se enfoca en explorar cómo los datos nos permiten entender mejor qué hacemos y por qué lo hacemos.

  • Competing on Analytics: Updated, with a New Introduction: The New Science of Winning; Este libro, escrito por Thomas Davenport, Jeanne Harris y David Abney, es una lectura fascinante para aquellos interesados en cómo se puede aplicar de Business Analytics. Aunque no es de naturaleza técnica, ofrece ejemplos contemporáneos y proporciona una revisión bastante completa de las diversas aplicaciones . Davenport es profesor en Babson College y contribuye regularmente a revistas de renombre como HBR. El libro es una herramienta útil para la evangelización en el ámbito de la analítica de negocios.
  • Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are: Este texto, de Seth Stephens-Davidowitz, es otra lectura cautivadora que destaca la increíble capacidad que ofrece el análisis de datos en la actualidad. Aunque no es técnico, su autor, un Ph.D. de Harvard y ex analista de datos en Google, muestra del poder y alcance de la analítica en el entendimiento de nuestro comportamiento. Además en su sitio web tiene muchos datos con los que se puede jugar y aprender. 

Libros de Fundamentos Teóricos para Gerentes:

En esta categoría, encontrarás libros ligeramente más técnicos que no se enfocan en el uso excesivo de códigos o notaciones complicadas. En cambio, se centran en aspectos esenciales, diseñados para ser más accesibles para aquellos que se adentran en estos temas por primera vez.

  • Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. Este libro, escrito por Foster Provost y Tom Fawcett, quienes son profesores de NYU Stern, proporciona un equilibrio perfecto entre conceptos técnicos y gerenciales, lo que lo convierte en un excelente recurso introductorio. Como señalan en su introducción, este libro no requiere conocimientos matemáticos avanzados. Sin embargo, no escatima en contenidos técnicos relevantes. El propósito es impartir una comprensión sólida de la ciencia de datos, más allá de una simple visión general. 
  • Business Analytics for Managers (Use R!): Un libro introductorio para gerentes. Tal como lo dice en su introducción, “el objetivo no es ser exhaustivo en todos y cada uno de los detalles de la minería de datos y la estadística, sino motivar la necesidad de la toma de decisiones basada en datos y proporcionar a los directivos el bagaje y el vocabulario necesarios para interactuar con éxito con personal especializado formado en minería de datos o estadística”.

Libros Técnicos Introductorios:

Estos libros ofrecen una oportunidad para adentrarse en los aspectos más complejos de los algoritmos y adquirir una comprensión más sólida de su implementación práctica. Aunque siguen siendo de nivel introductorio, son ideales para aquellos que desean profundizar en sus conocimientos en el campo de la ciencia de datos. Sin embargo, es importante tener en cuenta que pueden parecer intimidantes para aquellos que se acercan a esta disciplina por primera vez.

  • Practical Statistics for Data Scientists: 50 Essential Concepts. Escrito por Peter Bruce y Andrew Bruce. Si bien los autores afirman que se trata de un libro sobre estadística aplicada a ciencia de datos, lo cierto es que van un poquito más allá. Es un libro técnico, con código de R para emular los ejercicios e interpretar outputs. 
  • R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Escrito por Hadley Wickham (una autoridad en R) y Garrett Grolemund. Otro libro técnico pero muy útil, sobretodo para quienes queremos usar R como lenguaje base. Si bien desde la aparición de ChatGPT la escritura de código ha cambiado radicalmente, sigue siendo indispensable entender los fundamentos detrás de los lenguajes de programación. Este libro hace eso: cubre todo lo que se necesita saber de R como mínimo para trabajar en ciencia de datos. 
  • An Introduction to Statistical Learning:  Escrito por Gareth James, Daniela Witten, Trevor Hastie y Robert Tibshirani. De todos los que puse en esta categoría es el que más me gusta. Es técnico pero muy completo. La enorme ventaja de este libro es que hay un paquete en R con los distintos data sets y, además, se puede descargar una versión gratuita acá.  
  • Applied Predictive Modeling. Escrito por Max Kuhn y Kjell Johnson. Es muy técnico y completo, similar al anterior y que le sirve de complemento. Tiene una sección de ejercicios al final de cada capítulo realmente muy útil y completa. 
  • Statquest: No podía dejar de mencionar el maravilloso canal de YouTube de Josh Starmer, quien se desempeña como profesor en la Universidad de Carolina del Norte – Chapell Hill. Josh tiene ya varios años haciendo sencillos pero detallados videos en los que explica con una claridad asombrosa la mayoría de los conceptos y métodos de Machine Learning y Estadística. Lo pongo en esta categoría porque el contenido es altamente técnico pero muy accesible. Es una joya de canal, tanto para novatos como para expertos. Como diría él mismo Josh en sus videos: ¡¡Triple Bam!! 

Programas en INCAE relacionados con Datos:

Por último, no quería dejar de mencionar los distintos programas que tenemos en Incae en los que los datos juegan un rol central. En todos ellos colaboro de algunas forma y puedo dar fe del enorme esfuerzo que hay detrás del diseño de sus programas y contenidos. Hay para cada gusto, desde programas abiertos de “corta duración” hasta maestrías tiempo completo o de tiempo parcial.


Bueno, ahí la tienen: una lista con recursos en varios formatos y contenidos para zambullirse en el mundo de los datos.

Como toda lista que pretende ser útil y valiosa, es una lista incompleta. Con el tiempo y nuevas lecturas / aprendizajes, irá creciendo. Si tienen alguna sugerencia que crean que deba incluirse, escríbanla en los comentarios. Y si les pareció valiosa e interesante, compártanla en redes.

 


Foto de la portada por Alex Chumak on Unsplash

Deja un comentario

This site uses Akismet to reduce spam. Learn how your comment data is processed.