Python Data Cleaning Cookbook
-5%

Python Data Cleaning Cookbook

Modern techniques and Python tools to detect and remove dirty data and extract key insights

Walker, Michael / Escritor

84,23 €
80,02 €
IVA incluido
Editorial:
Packt Publishing Limited
Año de edición:
2020
Materia
Informática
ISBN:
978-1-80056-566-1
Páginas:
436
Idioma:
Inglés
Encuadernación:
Rústica
Alto:
235mm
Ancho:
190mm
84,23 €
80,02 €
IVA incluido
Añadir a favoritos

Discover how to describe your data in detail, identify data issues, and find out how to solve them using commonly used techniques and tips and tricksKey FeaturesGet well-versed with various data cleaning techniques to reveal key insightsManipulate data of different complexities to shape them into the right form as per your business needsClean, monitor, and validate large data volumes to diagnose problems before moving on to data analysisBook DescriptionGetting clean data to reveal insights is essential, as directly jumping into data analysis without proper data cleaning may lead to incorrect results. This book shows you tools and techniques that you can apply to clean and handle data with Python. You'll begin by getting familiar with the shape of data by using practices that can be deployed routinely with most data sources.

Then, the book teaches you how to manipulate data to get it into a useful form. You'll also learn how to filter and summarize data to gain insights and better understand what makes sense and what does not, along with discovering how to operate on data to address the issues you've identified. Moving on, you'll perform key tasks, such as handling missing values, validating errors, removing duplicate data, monitoring high volumes of data, and handling outliers and invalid dates.

Next, you'll cover recipes on using supervised learning and Naive Bayes analysis to identify unexpected values and classification errors, and generate visualizations for exploratory data analysis (EDA) to visualize unexpected values. Finally, you'll build functions and classes that you can reuse without modification when you have new data. By the end of this Python book, you'll be equipped with all the key skills that you need to clean data and diagnose problems within it.

What you will learnFind out how to read and analyze data from a variety of sourcesProduce summaries of the attributes of data frames, columns, and rowsFilter data and select columns of interest that satisfy given criteriaAddress messy data issues, including working with dates and missing valuesImprove your productivity in Python pandas by using method chainingUse visualizations to gain additional insights and identify potential data issuesEnhance your ability to learn what is going on in your dataBuild user-defined functions and classes to automate data cleaningWho this book is forThis book is for anyone looking for ways to handle messy, duplicate, and poor data using different Python tools and techniques. The book takes a recipe-based approach to help you to learn how to clean and manage data. Working knowledge of Python programming is all you need to get the most out of the book.

Artículos relacionados

  • Aprende SQL desde cero hasta avanzado
    Reyes Ochoa, Xavier / Escritor
    ¡Domina SQL desde cero y conviértete en un experto en bases de datos con este libro!La gestión y el análisis de datos se han convertido en habilidades fundamentales en la era digital, altamente demandadas en todo tipo de industrias. Sin embargo, muchas personas sienten que SQL es complejo o difícil de aprender. Xavier Reyes Ochoa, conocido como Programador X en YouTube, experto...
    En stock

    13,99 €13,29 €

  • Aprende Python desde cero hasta avanzado
    Reyes Ochoa, Xavier / Escritor
    El libro completo de la programacion python para principiantes: Con ejercicios prácticos y contenido bonus.¡Aprende a programar sin conocimientos previos y descubre el poder de Python con este libro!Programar es una habilidad extremadamente demandada, que ofrece muchas ventajas en la vida privada y profesional. Por eso es difícil de entender que pocas personas dominen la progra...
    En stock

    17,96 €17,06 €

  • Web3. Creando la próxima frontera económica y cultural de Internet
    Tapscott, Alex / Escritor
    En las tres últimas décadas hemos pasado de la "web de solo lectura" a la "web de lectura escritura", que ha convertido a los usuarios de Internet en creadores de contenido y ofrece infinitas oportunidades para la colaboración. Si bien esta nueva web revolucionó los medios de comunicación, el comercio y otras industrias, la proliferación de ciberataques, ataques de datos y la r...
    En stock

    30,95 €29,40 €

  • YouTube. La fórmula mágica
    Derral, Eva / Escritor
    A medida que YouTube se expande a pasos agigantados, la competencia entre creadores poralcanzar más popularidad y cifras altísimas de suscriptores es cada día mayor. Una viejacámara de iPhone y una estrategia de crecimiento no son suficientes para hacer crecer tucanal y mejorar tus ingresos. En 'YouTube. La fórmula mágica', el experto creador y coach deYouTube Derral Eves te mu...
    En stock

    26,95 €25,60 €

  • Ciberseguridad paso a paso
    ¿Sabías que el 60 % de las empresas que son atacadas cierra su negocio a los 6 meses? Enla nueva era digital, es vital elaborar una adecuada estrategia de ciberseguridad que nospermita protegernos de las amenazas de ciberseguridad y de los nuevos actores de amenazasdel ciberespacio. El cibercrimen tiene un coste de trillones de euros superando al PIB demuchos países. ¿Soy un ob...
    En stock

    37,50 €35,63 €

  • Patrones de diseño en JAVA
    Debrauwer, Laurent / Escritor
    Este libro presenta los 23 patrones de diseño (design patterns) fundamentales de forma concisa y práctica, ilustrándolos con ejemplos relevantes y rápidos de entender. Cada ejemplo se describe en UML y Java en forma de un pequeño programa, completo y ejecutable. Para cada patrón, el autor detalla su nombre, el problema correspondiente, la solución aportada, sus dominios de apli...
    En stock

    38,00 €36,10 €