TY - BOOK AU - McKinney, Wes TI - Python : : para análisis de datos manipulación de datos con pandas, numpy y jupyter con tecnología / SN - 9788441546837 U1 - 005.133 23 PY - 2022/// CY - España : PB - Anaya S.A, KW - Tecnología computacional KW - Python (Lenguaje de programación) KW - Software de aplicación KW - Desarrollo N1 - incluye índice de contenidos, página 9; incluye índice alfabético, página 501.; 1. Preliminares. 1.1 ¿De qué trata este libro? ¿Qué tipos de datos? 1.2 ¿Por qué Python para análisis de datos? Python como elemento de unión Resolver el problema de «los dos lenguajes ¿Por qué no Python? 1.3 Librerías esenciales de Python NumPy pandas matplotlib IPython y Jupyter SciPy scikit-learn statsmodels Otros paquetes 1.4 Instalación y configuración Miniconda en Windows GNU/Linux Miniconda en macOS Instalar los paquetes necesarios Entornos de desarrollo integrados y editores de texto 1.5 Comunidad y conferencias 1.6 Navegar por este libro Códigos de ejemplo Datos para los ejemplos Convenios de importación ; 2. Fundamentos del lenguaje Python, IPython y Jupyter Notebooks. 2.1 El intérprete de Python 2.2 Fundamentos de IPython Ejecutar el shell de IPython Ejecutar el notebook de Jupyter Autocompletado Introspección 2.3 Fundamentos del lenguaje Python Semántica del lenguaje Tipos escalares Control de flujo 2.4 Conclusión ; 3. Estructuras de datos integrados, funciones y archivos. 3.1 Estructuras de datos y secuencias Tupla Listas Diccionario Conjunto o set Funciones de secuencia integradas Comprensiones de lista, conjunto y diccionario 3.2 Funciones Espacios de nombres, ámbito y funciones locales Devolver varios valores Las funciones son objetos Funciones anónimas (lambda) Generadores Errores y manejo de excepciones 3.3 Archivos y el sistema operativo Bytes y Unicode con archivos 3.4 Conclusión ; 4. Fundamentos de NumPy: arrays y computación vectorizada. 4.1 El ndarray de NumPy: un objeto array multidimensional Creando ndarrays Tipos de datos para ndarrays Aritmética con arrays NumPy Indexado y corte básicos Indexado booleano Indexado sofisticado Transponer arrays e intercambiar ejes 4.2 Generación de números pseudoaleatoris 4.3 Funciones universales: funciones rápidas de array elemento a elemento 4.4 Programación orientada a arrays con arrays Expresar lógica condicional como operaciones de arrays Métodos matemáticos y estadísticos Métodos para arrays booleanos Ordenación Unique y otra lógica de conjuntos 4.5 Entrada y salida de archivos con arrays 4.6 Algebra lineal 4.7 Ejemplo: caminos aleatorios Simulando muchos caminos aleatorios al mismo tiempo 4.8 Conclusión ; 5. Empezar a trabajar con pandas 5.1 Introducción a las estructuras de datos de pandas Series DataFrame Objetos indice 5.2 Funcionalidad esencial Reindexación Eliminar entradas de un eje Indexación, selección y filtrado Aritmética y alineación de datos Aplicación y asignación de funciones Ordenación y asignación de rangos Índices de ejes con etiquetas duplicadas 5.3 Resumir y calcular estadísticas descriptivas Correlación y covarianza Valores únicos, recuentos de valores y pertenencia 5.4 Conclusión ; 6. Carga de datos, almacenamiento y formatos de archivo. 6.1 Lectura y escritura de datos en formato de texto Leer archivos de texto por partes Escribir datos en formato de texto Trabajar con otros formatos delimitados Datos JSON XML y HTML: raspado web 6.2 Formatos de datos binarios Leer archivos de Microsoft Excel Utilizar el formato HDF5 6.3 Interactuar con API web 6.4 Interactuar con bases de datos 6.5 Conclusión ; 7. Limpieza y preparación de los datos. 7.1 Gestión de los datos que faltan Filtrado de datos que faltan Relienado de datos ausentes 7.2 Transformación de datos Eliminación de duplicados Transformación de datos mediante una función o una asignación Reemplazar valores Renombrar índices de eje Discretización Detección y filtrado de valores atípicos Permutación y muestreo aleatorio Calcular variables dummy o indicadoras 7.3 Tipos de datos de extensión 7.4 Manipulación de cadenas de texto Métodos de objeto de cadena de texto internos de Python Expresiones regulares Funciones de cadena de texto en pandas 7.5 Datos categóricos Antecedentes y motivación Tipo de extensión Categorical en pandas Cálculos con variables categóricas Métodos categóricos 7.6 Conclusión ; 8. Disputa de datos: unión, combinación y remodelación. 8.1 Indexación jerárquica Reordenación y clasificación de niveles Estadísticas de resumen por nivel Indexación con las columnas de un dataframe 8.2 Combinación y fusión de conjuntos de datos Uniones de dataframes al estilo de una base de datos Fusión según el índice Concatenación a lo largo de un eje Combinar datos con superposición 8.3 Remodelación y transposición Remodelación con indexación jerárquica Transponer del formato «largo» al ancho Transponer del formato «ancho» al «largo 8.4 Conclusión ; 9. Gráficos y visualización 9.1 Una breve introducción a la API matplotlib Figuras y subgráficos Colores, marcadores y estilos de línea Marcas, etiquetas y leyendas Anotaciones y dibujos en un subgráfico Almacenamiento de gráficos en archivo Configuración de matplotlib 9.2 Realización de gráficos con pandas y seaborn Gráficos de líneas Gráficos de barras Histogramas y gráficos de densidad Gráficos de dispersión o de puntos Cuadrícula de facetas y datos categóricos 9.3. Otras herramientas de visualización de Python 9.4 Conclusión ; 10. Agregación de datos y operaciones con grupos 10.1 Entender las operaciones de grupos Iteración a través de grupos Selección de una columna o subconjunto de columnas Agrupamiento con diccionarios y series Agrupamiento con funciones Agrupamiento por niveles de índice 10.2 Agregación de datos Aplicación de varias funciones a columnas Devolución de datos agregados sin índices de fila 10.3 El método apply: un split-apply-combine general Supresión de las claves de grupos Análisis de cuantil y contenedor Ejemplo: Rellenar valores faltantes con valores específicos de grupo Ejemplo: Muestreo aleatorio y permutación Ejemplo: media ponderada de grupo y correlación Ejemplo: Regresión lineal por grupos 10.4 Transformaciones de grupos y funciones GroupBy «simplificadas>> 10.5 Tablas dinámicas y tabulación cruzada Tabulaciones cruzadas 10.6 Conclusión ; 11. Series temporales. 11.1 Tipos de datos de fecha y hora y herramientas asociadas Conversión entre cadena de texto y datetime 11.2 Fundamentos de las series temporales Indexación, selección y creación de subconjuntos Series temporales con índices duplicados 11.3 Rangos de fechas, frecuencias y desplazamiento Generación de rangos de fechas Frecuencias y desfases de fechas Desplazamiento de los datos (adelantar y retrasar) 11.4 Manipulación de zonas horarias Localización y conversión de zonas horarias Operaciones con objetos de marca temporal conscientes de la zona horaria Operaciones entre distintas zonas horarias 11.5 Periodos y aritmética de periodos Conversión de frecuencias de periodos Frecuencias de periodos trimestrales Conversión de marcas temporales a periodos (y viceversa) Creación de un objeto PeriodIndex a partir de arrays 11.6 Remuestreo y conversión de frecuencias Submuestreo Sobremuestreo e interpolación Remuestreo con periodos Remuestreo de tiempo agrupado 11.7 Funciones de ventana móvil Funciones ponderadas exponencialmente Funciones binarias de ventana móvil Funciones de ventana móvil definidas por el usuario 11.8 Conclusión ; 12. Introducción a las librerías de creación de modelos de Python. 12.1 Interconexión entre pandas y el código para la creación de modelos 12.2 Creación de descripciones de modelos con Patsy Transformaciones de datos en fórmulas Patsy Datos categóricos y Patsy 12.3 Introducción a statsmodels Estimación de modelos lineales Estimación de procesos de series temporales 12.4 Introducción a scikit-learn 12.5 Conclusión ; 13. Ejemplos de análisis de datos. 13.1 Datos Bitly de 1.USA.gov Recuento de zonas horarias en Python puro Recuento de zonas horarias con pandas 13.2 Conjunto de datos MovieLens IM Medición del desacuerdo en las valoraciones 13.3 Nombres de bebés de Estados Unidos entre 1880 y 2010 Análisis de tendencias en los nombres 13.4 Base de datos de alimentos del USDA 13.5 Base de datos de la Comisión de Elecciones Federales de 2012 Estadísticas de donación por ocupación y empleador Incluir donaciones en contenedores Estadísticas de donación por estado 13.6 Conclusión ER -