Local cover image
Local cover image

Python : para análisis de datos manipulación de datos con pandas, numpy y jupyter con tecnología / Wes Mckinney.

By: Material type: TextTextPublication details: España : Anaya S.A, 2022.Edition: primera ediciónDescription: 520 páginas : graficas, 23 cmContent type:
  • Texto
Media type:
  • Sin mediación
Carrier type:
  • Volumen
ISBN:
  • 9788441546837
Subject(s): DDC classification:
  • 005.133 M158 2022 23
Contents:
1. Preliminares. 1.1 ¿De qué trata este libro? ¿Qué tipos de datos? 1.2 ¿Por qué Python para análisis de datos? Python como elemento de unión Resolver el problema de «los dos lenguajes ¿Por qué no Python? 1.3 Librerías esenciales de Python NumPy pandas matplotlib IPython y Jupyter SciPy scikit-learn statsmodels Otros paquetes 1.4 Instalación y configuración Miniconda en Windows GNU/Linux Miniconda en macOS Instalar los paquetes necesarios Entornos de desarrollo integrados y editores de texto 1.5 Comunidad y conferencias 1.6 Navegar por este libro Códigos de ejemplo Datos para los ejemplos Convenios de importación
2. Fundamentos del lenguaje Python, IPython y Jupyter Notebooks. 2.1 El intérprete de Python 2.2 Fundamentos de IPython Ejecutar el shell de IPython Ejecutar el notebook de Jupyter Autocompletado Introspección 2.3 Fundamentos del lenguaje Python Semántica del lenguaje Tipos escalares Control de flujo 2.4 Conclusión
3. Estructuras de datos integrados, funciones y archivos. 3.1 Estructuras de datos y secuencias Tupla Listas Diccionario Conjunto o set Funciones de secuencia integradas Comprensiones de lista, conjunto y diccionario 3.2 Funciones Espacios de nombres, ámbito y funciones locales Devolver varios valores Las funciones son objetos Funciones anónimas (lambda) Generadores Errores y manejo de excepciones 3.3 Archivos y el sistema operativo Bytes y Unicode con archivos 3.4 Conclusión
4. Fundamentos de NumPy: arrays y computación vectorizada. 4.1 El ndarray de NumPy: un objeto array multidimensional Creando ndarrays Tipos de datos para ndarrays Aritmética con arrays NumPy Indexado y corte básicos Indexado booleano Indexado sofisticado Transponer arrays e intercambiar ejes 4.2 Generación de números pseudoaleatoris 4.3 Funciones universales: funciones rápidas de array elemento a elemento 4.4 Programación orientada a arrays con arrays Expresar lógica condicional como operaciones de arrays Métodos matemáticos y estadísticos Métodos para arrays booleanos Ordenación Unique y otra lógica de conjuntos 4.5 Entrada y salida de archivos con arrays 4.6 Algebra lineal 4.7 Ejemplo: caminos aleatorios Simulando muchos caminos aleatorios al mismo tiempo 4.8 Conclusión
5. Empezar a trabajar con pandas 5.1 Introducción a las estructuras de datos de pandas Series DataFrame Objetos indice 5.2 Funcionalidad esencial Reindexación Eliminar entradas de un eje Indexación, selección y filtrado Aritmética y alineación de datos Aplicación y asignación de funciones Ordenación y asignación de rangos Índices de ejes con etiquetas duplicadas 5.3 Resumir y calcular estadísticas descriptivas Correlación y covarianza Valores únicos, recuentos de valores y pertenencia 5.4 Conclusión
6. Carga de datos, almacenamiento y formatos de archivo. 6.1 Lectura y escritura de datos en formato de texto Leer archivos de texto por partes Escribir datos en formato de texto Trabajar con otros formatos delimitados Datos JSON XML y HTML: raspado web 6.2 Formatos de datos binarios Leer archivos de Microsoft Excel Utilizar el formato HDF5 6.3 Interactuar con API web 6.4 Interactuar con bases de datos 6.5 Conclusión
7. Limpieza y preparación de los datos. 7.1 Gestión de los datos que faltan Filtrado de datos que faltan Relienado de datos ausentes 7.2 Transformación de datos Eliminación de duplicados Transformación de datos mediante una función o una asignación Reemplazar valores Renombrar índices de eje Discretización Detección y filtrado de valores atípicos Permutación y muestreo aleatorio Calcular variables dummy o indicadoras 7.3 Tipos de datos de extensión 7.4 Manipulación de cadenas de texto Métodos de objeto de cadena de texto internos de Python Expresiones regulares Funciones de cadena de texto en pandas 7.5 Datos categóricos Antecedentes y motivación Tipo de extensión Categorical en pandas Cálculos con variables categóricas Métodos categóricos 7.6 Conclusión
8. Disputa de datos: unión, combinación y remodelación. 8.1 Indexación jerárquica Reordenación y clasificación de niveles Estadísticas de resumen por nivel Indexación con las columnas de un dataframe 8.2 Combinación y fusión de conjuntos de datos Uniones de dataframes al estilo de una base de datos Fusión según el índice Concatenación a lo largo de un eje Combinar datos con superposición 8.3 Remodelación y transposición Remodelación con indexación jerárquica Transponer del formato «largo» al ancho Transponer del formato «ancho» al «largo 8.4 Conclusión
9. Gráficos y visualización 9.1 Una breve introducción a la API matplotlib Figuras y subgráficos Colores, marcadores y estilos de línea Marcas, etiquetas y leyendas Anotaciones y dibujos en un subgráfico Almacenamiento de gráficos en archivo Configuración de matplotlib 9.2 Realización de gráficos con pandas y seaborn Gráficos de líneas Gráficos de barras Histogramas y gráficos de densidad Gráficos de dispersión o de puntos Cuadrícula de facetas y datos categóricos 9.3. Otras herramientas de visualización de Python 9.4 Conclusión
10. Agregación de datos y operaciones con grupos 10.1 Entender las operaciones de grupos Iteración a través de grupos Selección de una columna o subconjunto de columnas Agrupamiento con diccionarios y series Agrupamiento con funciones Agrupamiento por niveles de índice 10.2 Agregación de datos Aplicación de varias funciones a columnas Devolución de datos agregados sin índices de fila 10.3 El método apply: un split-apply-combine general Supresión de las claves de grupos Análisis de cuantil y contenedor Ejemplo: Rellenar valores faltantes con valores específicos de grupo Ejemplo: Muestreo aleatorio y permutación Ejemplo: media ponderada de grupo y correlación Ejemplo: Regresión lineal por grupos 10.4 Transformaciones de grupos y funciones GroupBy «simplificadas>> 10.5 Tablas dinámicas y tabulación cruzada Tabulaciones cruzadas 10.6 Conclusión
11. Series temporales. 11.1 Tipos de datos de fecha y hora y herramientas asociadas Conversión entre cadena de texto y datetime 11.2 Fundamentos de las series temporales Indexación, selección y creación de subconjuntos Series temporales con índices duplicados 11.3 Rangos de fechas, frecuencias y desplazamiento Generación de rangos de fechas Frecuencias y desfases de fechas Desplazamiento de los datos (adelantar y retrasar) 11.4 Manipulación de zonas horarias Localización y conversión de zonas horarias Operaciones con objetos de marca temporal conscientes de la zona horaria Operaciones entre distintas zonas horarias 11.5 Periodos y aritmética de periodos Conversión de frecuencias de periodos Frecuencias de periodos trimestrales Conversión de marcas temporales a periodos (y viceversa) Creación de un objeto PeriodIndex a partir de arrays 11.6 Remuestreo y conversión de frecuencias Submuestreo Sobremuestreo e interpolación Remuestreo con periodos Remuestreo de tiempo agrupado 11.7 Funciones de ventana móvil Funciones ponderadas exponencialmente Funciones binarias de ventana móvil Funciones de ventana móvil definidas por el usuario 11.8 Conclusión
12. Introducción a las librerías de creación de modelos de Python. 12.1 Interconexión entre pandas y el código para la creación de modelos 12.2 Creación de descripciones de modelos con Patsy Transformaciones de datos en fórmulas Patsy Datos categóricos y Patsy 12.3 Introducción a statsmodels Estimación de modelos lineales Estimación de procesos de series temporales 12.4 Introducción a scikit-learn 12.5 Conclusión
13. Ejemplos de análisis de datos. 13.1 Datos Bitly de 1.USA.gov Recuento de zonas horarias en Python puro Recuento de zonas horarias con pandas 13.2 Conjunto de datos MovieLens IM Medición del desacuerdo en las valoraciones 13.3 Nombres de bebés de Estados Unidos entre 1880 y 2010 Análisis de tendencias en los nombres 13.4 Base de datos de alimentos del USDA 13.5 Base de datos de la Comisión de Elecciones Federales de 2012 Estadísticas de donación por ocupación y empleador Incluir donaciones en contenedores Estadísticas de donación por estado 13.6 Conclusión
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Call number Materials specified Copy number Status Notes Date due Barcode
Libro de Reserva Libro de Reserva Biblioteca William Corredor Gómez. Sede Cosmos (Barranquilla) 005.133 M158 2022 (Browse shelf(Opens below)) Ingeniería de Sistemas / Barranquilla Ej. 1 Available Colección 1, Isla 1, Lado A, Módulo 5 301257971

incluye índice de contenidos, página 9.

incluye índice alfabético, página 501.

1. Preliminares.
1.1 ¿De qué trata este libro?
¿Qué tipos de datos?
1.2 ¿Por qué Python para análisis de datos? Python como elemento de unión Resolver el problema de «los dos lenguajes ¿Por qué no Python?
1.3 Librerías esenciales de Python
NumPy
pandas
matplotlib
IPython y Jupyter
SciPy
scikit-learn
statsmodels
Otros paquetes

1.4 Instalación y configuración
Miniconda en Windows
GNU/Linux
Miniconda en macOS
Instalar los paquetes necesarios
Entornos de desarrollo integrados y editores de texto

1.5 Comunidad y conferencias
1.6 Navegar por este libro
Códigos de ejemplo
Datos para los ejemplos Convenios de importación

2. Fundamentos del lenguaje Python, IPython y Jupyter Notebooks.
2.1 El intérprete de Python
2.2 Fundamentos de IPython Ejecutar el shell de IPython
Ejecutar el notebook de Jupyter
Autocompletado Introspección
2.3 Fundamentos del lenguaje Python
Semántica del lenguaje
Tipos escalares
Control de flujo
2.4 Conclusión

3. Estructuras de datos integrados, funciones y archivos.
3.1 Estructuras de datos y secuencias
Tupla
Listas
Diccionario
Conjunto o set
Funciones de secuencia integradas
Comprensiones de lista, conjunto y diccionario
3.2 Funciones
Espacios de nombres, ámbito y funciones locales
Devolver varios valores
Las funciones son objetos
Funciones anónimas (lambda)
Generadores
Errores y manejo de excepciones
3.3 Archivos y el sistema operativo
Bytes y Unicode con archivos
3.4 Conclusión

4. Fundamentos de NumPy: arrays y computación vectorizada.
4.1 El ndarray de NumPy: un objeto array multidimensional Creando ndarrays
Tipos de datos para ndarrays
Aritmética con arrays NumPy Indexado y corte básicos
Indexado booleano
Indexado sofisticado
Transponer arrays e intercambiar ejes
4.2 Generación de números pseudoaleatoris
4.3 Funciones universales: funciones rápidas de array elemento a elemento
4.4 Programación orientada a arrays con arrays
Expresar lógica condicional como operaciones de arrays
Métodos matemáticos y estadísticos
Métodos para arrays booleanos
Ordenación
Unique y otra lógica de conjuntos
4.5 Entrada y salida de archivos con arrays
4.6 Algebra lineal
4.7 Ejemplo: caminos aleatorios
Simulando muchos caminos aleatorios al mismo tiempo
4.8 Conclusión

5. Empezar a trabajar con pandas
5.1 Introducción a las estructuras de datos de pandas
Series
DataFrame
Objetos indice
5.2 Funcionalidad esencial
Reindexación
Eliminar entradas de un eje
Indexación, selección y filtrado
Aritmética y alineación de datos
Aplicación y asignación de funciones
Ordenación y asignación de rangos
Índices de ejes con etiquetas duplicadas
5.3 Resumir y calcular estadísticas descriptivas Correlación y covarianza
Valores únicos, recuentos de valores y pertenencia
5.4 Conclusión

6. Carga de datos, almacenamiento y formatos de archivo.
6.1 Lectura y escritura de datos en formato de texto
Leer archivos de texto por partes
Escribir datos en formato de texto
Trabajar con otros formatos delimitados
Datos JSON XML y HTML: raspado web
6.2 Formatos de datos binarios
Leer archivos de Microsoft Excel
Utilizar el formato HDF5
6.3 Interactuar con API web
6.4 Interactuar con bases de datos
6.5 Conclusión

7. Limpieza y preparación de los datos.
7.1 Gestión de los datos que faltan
Filtrado de datos que faltan Relienado de datos ausentes
7.2 Transformación de datos
Eliminación de duplicados
Transformación de datos mediante una función o una asignación
Reemplazar valores
Renombrar índices de eje
Discretización
Detección y filtrado de valores atípicos
Permutación y muestreo aleatorio
Calcular variables dummy o indicadoras
7.3 Tipos de datos de extensión
7.4 Manipulación de cadenas de texto Métodos de objeto de cadena de texto internos de Python Expresiones regulares
Funciones de cadena de texto en pandas
7.5 Datos categóricos

Antecedentes y motivación
Tipo de extensión
Categorical en pandas
Cálculos con variables categóricas
Métodos categóricos
7.6 Conclusión

8. Disputa de datos: unión, combinación y remodelación.
8.1 Indexación jerárquica
Reordenación y clasificación de niveles
Estadísticas de resumen por nivel Indexación con las columnas de un dataframe
8.2 Combinación y fusión de conjuntos de datos Uniones de dataframes al estilo de una base de datos Fusión según el índice Concatenación a lo largo de un eje Combinar datos con superposición
8.3 Remodelación y transposición Remodelación con indexación jerárquica Transponer del formato «largo» al ancho Transponer del formato «ancho» al «largo
8.4 Conclusión

9. Gráficos y visualización
9.1 Una breve introducción a la API matplotlib
Figuras y subgráficos Colores, marcadores y estilos de línea Marcas, etiquetas y leyendas Anotaciones y dibujos en un subgráfico
Almacenamiento de gráficos en archivo
Configuración de matplotlib
9.2 Realización de gráficos con pandas y seaborn Gráficos de líneas Gráficos de barras Histogramas y gráficos de densidad Gráficos de dispersión o de puntos
Cuadrícula de facetas y datos categóricos
9.3. Otras herramientas de visualización de Python
9.4 Conclusión

10. Agregación de datos y operaciones con grupos
10.1 Entender las operaciones de grupos Iteración a través de grupos
Selección de una columna o subconjunto de columnas
Agrupamiento con diccionarios y series
Agrupamiento con funciones
Agrupamiento por niveles de índice
10.2 Agregación de datos
Aplicación de varias funciones a columnas
Devolución de datos agregados sin índices de fila
10.3 El método apply: un split-apply-combine general
Supresión de las claves de grupos
Análisis de cuantil y contenedor
Ejemplo: Rellenar valores faltantes con valores específicos de grupo
Ejemplo: Muestreo aleatorio y permutación
Ejemplo: media ponderada de grupo y correlación
Ejemplo: Regresión lineal por grupos
10.4 Transformaciones de grupos y funciones GroupBy «simplificadas>>
10.5 Tablas dinámicas y tabulación cruzada
Tabulaciones cruzadas
10.6 Conclusión

11. Series temporales.
11.1 Tipos de datos de fecha y hora y herramientas asociadas
Conversión entre cadena de texto y datetime
11.2 Fundamentos de las series temporales Indexación, selección y creación de subconjuntos
Series temporales con índices duplicados
11.3 Rangos de fechas, frecuencias y desplazamiento
Generación de rangos de fechas
Frecuencias y desfases de fechas
Desplazamiento de los datos (adelantar y retrasar)
11.4 Manipulación de zonas horarias
Localización y conversión de zonas horarias
Operaciones con objetos de marca temporal conscientes de la zona horaria
Operaciones entre distintas zonas horarias
11.5 Periodos y aritmética de periodos
Conversión de frecuencias de periodos
Frecuencias de periodos trimestrales
Conversión de marcas temporales a periodos (y viceversa)
Creación de un objeto PeriodIndex a partir de arrays
11.6 Remuestreo y conversión de frecuencias
Submuestreo
Sobremuestreo e interpolación
Remuestreo con periodos
Remuestreo de tiempo agrupado
11.7 Funciones de ventana móvil
Funciones ponderadas exponencialmente
Funciones binarias de ventana móvil
Funciones de ventana móvil definidas por el usuario
11.8 Conclusión

12. Introducción a las librerías de creación de modelos de Python.
12.1 Interconexión entre pandas y el código para la creación de modelos
12.2 Creación de descripciones de modelos con Patsy
Transformaciones de datos en fórmulas Patsy
Datos categóricos y Patsy
12.3 Introducción a statsmodels
Estimación de modelos lineales
Estimación de procesos de series temporales
12.4 Introducción a scikit-learn
12.5 Conclusión

13. Ejemplos de análisis de datos.
13.1 Datos Bitly de 1.USA.gov
Recuento de zonas horarias en Python puro
Recuento de zonas horarias con pandas
13.2 Conjunto de datos MovieLens IM
Medición del desacuerdo en las valoraciones
13.3 Nombres de bebés de Estados Unidos entre 1880 y 2010
Análisis de tendencias en los nombres
13.4 Base de datos de alimentos del USDA
13.5 Base de datos de la Comisión de Elecciones Federales de 2012 Estadísticas de donación por ocupación y empleador
Incluir donaciones en contenedores
Estadísticas de donación por estado
13.6 Conclusión

There are no comments on this title.

to post a comment.

Click on an image to view it in the image viewer

Local cover image