Python 데이터 분석 입문: pandas, numpy, matplotlib 활용법

Python 데이터 분석 입문: pandas, numpy, matplotlib 활용법

안녕하세요 여러분! 😊
데이터 분석을 해보고 싶은데, 어디서부터 시작해야 할지 막막하셨나요?
Python을 활용하면 데이터를 효과적으로 다룰 수 있고, 특히 pandas, numpy, matplotlib는 필수적인 라이브러리입니다!
오늘은 이 세 가지 라이브러리를 활용하는 방법을 쉽고 친절하게 설명해드릴게요. 💡




pandas란? 데이터 분석의 핵심 라이브러리

pandas는 데이터 분석을 위해 가장 널리 사용되는 Python 라이브러리입니다. 데이터 프레임을 통해 엑셀처럼 데이터를 다룰 수 있어요.📊
기본적인 pandas 기능을 알아볼까요?

    
        import pandas as pd

        # 간단한 데이터프레임 생성
        data = {'이름': ['철수', '영희', '민수'], '나이': [25, 30, 27]}
        df = pd.DataFrame(data)

        print(df)
    

numpy란? 숫자 데이터를 다루는 강력한 도구

numpy는 대규모 배열 및 행렬 연산을 수행하는 데 유용한 라이브러리입니다. 데이터 분석에서 연산 속도를 높이는 데 필수적이에요. 🚀

    
        import numpy as np

        # 1차원 배열 생성
        arr = np.array([1, 2, 3, 4, 5])
        print(arr)

        # 2차원 배열 생성
        matrix = np.array([[1, 2, 3], [4, 5, 6]])
        print(matrix)
    

matplotlib으로 데이터 시각화하기

matplotlib는 데이터를 시각적으로 표현할 때 사용됩니다. 📈
간단한 그래프를 그려볼까요?

    
        import matplotlib.pyplot as plt

        x = [1, 2, 3, 4, 5]
        y = [10, 20, 25, 30, 50]

        plt.plot(x, y, marker='o')
        plt.xlabel('X축')
        plt.ylabel('Y축')
        plt.title('간단한 선 그래프')
        plt.show()
    

실전 예제: pandas와 numpy를 활용한 데이터 분석

이번에는 pandas와 numpy를 활용하여 평균 나이를 계산해볼까요? 🎯

    
        import pandas as pd
        import numpy as np

        data = {'이름': ['철수', '영희', '민수'], '나이': [25, 30, 27]}
        df = pd.DataFrame(data)

        # 평균 나이 계산
        avg_age = np.mean(df['나이'])
        print(f'평균 나이: {avg_age}')
    

matplotlib을 활용한 데이터 시각화 예제

pandas 데이터를 활용하여 막대 그래프를 만들어볼까요? 📊

    
        import matplotlib.pyplot as plt

        names = ['철수', '영희', '민수']
        ages = [25, 30, 27]

        plt.bar(names, ages, color='blue')
        plt.xlabel('이름')
        plt.ylabel('나이')
        plt.title('이름별 나이 막대 그래프')
        plt.show()
    

자주 묻는 질문 (FAQ)

pandas와 numpy의 차이는 무엇인가요?

numpy는 수학적 연산을 위한 라이브러리이고, pandas는 데이터 분석 및 조작을 위한 라이브러리입니다.

matplotlib 이외에 추천하는 시각화 라이브러리는?

seaborn과 plotly도 많이 사용됩니다. 특히 seaborn은 스타일이 예쁘고, plotly는 인터랙티브한 시각화가 가능합니다.


여기까지 읽어주셔서 감사합니다! 😊
데이터 분석이 어렵게 느껴질 수도 있지만, 꾸준히 연습하면 금방 익숙해질 거예요!

다음 이전