Python/Data Science 3

[데이터 시각화] 연속형 변수 시각화

데이터 시각화 기본 그래프 chat gpt에게 기본 코드를 기반으로 요청사항을 이야기 한다.  Central Tendencies (중심성) 1. Mean (평균): Sum of all observed values / N 2. Median (중앙값): Split "sorted data" into half 3. Mode (최빈값): Most frequently occuring value. Mode는 Median보다 작다. 4. Skew (left, right), shape outlier 데이터 이상점 이상점은 다른 자료와는 극단적으로 다른 값, 즉 유달리 높거나 낮은 값을 보이는 것을 일컫는다. import numpy as np #compute mean 평균값 mean_budget = np.mean(df[..

Python/Data Science 2024.04.08

[데이터 시각화] colab에 seaborn 설치/시작하기

구글 Colab에서 Seaborn을 설치하고 시작하는 방법 Installing and getting started — seaborn 0.13.2 documentation Installing and getting started Official releases of seaborn can be installed from PyPI: The basic invocation of pip will install seaborn and, if necessary, its mandatory dependencies. It is possible to include optional dependencies that give access to a fe seaborn.pydata.org 먼저 구글 Colab을 열고 새 Python 노트..

Python/Data Science 2024.04.03

[데이터 시각화] Seaborn에 대하여

@Seaborn Statistical Data Visualization library based on matplotlib. ? matplotlib (2002) 파이썬 오픈소스 라이브러리 중에 가장 널리 사용되는 시각화 라이브러리 2002년부터 만들어졌으며, MATLAB 기능을 파이썬으로 가져오는 컨셉으로 시작 각종 논문에서 figure를 그릴 때, 사용될 만큼 깔끔하게 그래프를 그려주는 것으로 유명 figure라는 도화지에 여러가지 component를 얹어서 그래프를 완성하는 컨셉으로 구현됨 시각화에 2가지 방법이 있음 (1) pyplot를 이용하여 구현하는 방법 빠르고 적당한 퀄리티의 그래프 (2) OOP-style를 이용하여 구현하는 방법 디테일하게 많은 것을 표현하려면 이 방법으로 구현 ? Seab..

Python/Data Science 2024.04.02