Sustituir ciclos con map, filter y reduce.

Posted on vie 07 febrero 2020 in Tutorial de Python • Tagged with Python, Maps, Filter, Reduce • 5 min read

Uso de Map,Filter y Reduce


Continue reading

Usar memcached para tener datos a la mano

Posted on dom 22 septiembre 2019 in Tutorial de Python • Tagged with Debian, Python, Ubuntu, memcached, Fedora • 2 min read

Hay casos donde se toma datos de una base de datos que puede ser algo lenta y se tiene que volver a buscar esos datos, para eso es mejor tener una cache con los datos a fin de reducir la latencia que nos puede generar las consultas a la base de datos. Para realizarlo se usará memcached en Python.


Continue reading

Crear entorno de desarrollo para Ciencia de Datos con Anaconda, Jupyter, git y cookiecutter

Posted on dom 28 julio 2019 in Tutorial de Data Science • Tagged with Debian, Ubuntu, Linux, Python, Data Science, Ciencia de Datos, Entorno Desarrollo • 5 min read

Entorno de desarrollo con anaconda, Jupyter, git, black y cookiecutter para Ciencia de datos


Continue reading

Validando un API rest asíncrono con Cerberus

Posted on sáb 08 junio 2019 in Tutorial de Python • Tagged with Debian, Python, aiohttp, Ubuntu, API rest, asincrono, Cerberus • 8 min read

Se creará un API rest asíncrono (usando aiohttp), donde se valida la entrada con cerberus


Continue reading

Cómo usar el API de wikipedia con Python

Posted on sáb 08 junio 2019 in Tutorial de Python • Tagged with Debian, Python, Wikipedia, Ubuntu • 10 min read

Uso de API de Wikipedia con Python


Continue reading

Visualizando estadisticas de pokemon usando plotly ( gráfica de radar)

Posted on sáb 01 diciembre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Visualización, Plotly, Data Science, Ciencia de Datos, Kaggle, Pandas, Numpy • 4 min read

Luego de un tiempo sin escribir, retomo los artículos sobre Ciencia de Datos, ahora con visualización de datos. Para ello se usará la estadística de un repositorio de datos sobre los pokemon.

El gráfico radar es un gráfico que consiste en una secuencia de radios equi-angulares, llamados radios, y cada …


Continue reading

Analizando datos del cambio climático y niveles de CO2 en la atmosfera con Python y pandas.

Posted on dom 14 octubre 2018 in Tutorial Python • Tagged with Python, Kaggle, Pandas, Matplotlib, Seaborn, Cambio Climático, CO2, Data Science, Ciencia de Datos • 8 min read

Continuando con los artículos sobre ciencia de datos, esta vez se analizará datos sobre información del clima global y por países, así como los niveles de CO2.

Estos datos y proyecto los encontré en el sitio kaggle, este sitio es para publicar proyectos de ciencia de datos. Los datos para …


Continue reading

Generar gráficos animados de burbuja a lo Gapminer con Python

Posted on sáb 06 octubre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Numpy, Pandas, Visualización, Data Science, Ciencia de Datos, Gapminer • 3 min read

En febrero de 2013 creé un artículo sobre Cómo hacer gráficos de burbujas con matplotlib, la idea era ver como se generaba una gráfica al estilo de la presentación de Hans Rosling (por cierto, murió en Febrero de 2017).

A continuación el vídeo que explica la historia de 200 países …


Continue reading

Contar palabras de un texto usando Spark con PySpark

Posted on mar 03 julio 2018 in Tutorial Python • Tagged with Python, Spark, PySpark • 5 min read

En el artículo anterior se explicó el procedimiento de instalación de Spark usando Docker. En este artículo se usará un texto tomado de la página de la ONU, de ahí se extrae las líneas y se cuentan las palabras.

A continuación el texto que se va a utilizar (lo pueden …


Continue reading

Como correr Apache Spark desde una imagen Docker

Posted on lun 02 julio 2018 in Tutorial Python • Tagged with Python, Spark, Docker, Big Data, Data Science, Ciencia de Datos • 3 min read

En este artículo se explicará la ejecución de Apache Spark usando un contenedor Docker, en vez de usar el procedimiento de instalación de Spark (instalar java, scala y spark).

Apache Spark proporciona una interfaz para la programación de clusters completos con paralelismos de Datos implicito y tolerancia a fallos. Tiene …


Continue reading