본문 바로가기

반응형

코딩TIPS

[plotly]line 그래프 그리기 plotly의 line을 이용해서 그래프를 그려보겠습니다. 라이브러리를 import 하고 기본 제공 데이터중 gapminder를 load 했습니다. gapminder에는 국가별 기대수명 데이터가 들어 있습니다. import plotly.express as px df=px.data.gapminder() df.head() 기본 그래프를 그리는 방식은 data_frame지정, x축, y축을 지정하면 되고, 마지막에 fig.show()를 넣어주어야 그래프가 표시됩니다. 우리나라의 연도별 기대수명 그래프를 그리겠습니다. fig=px.line(data_frame=df.loc[df['country']=='Korea, Rep.'], x='year', y='lifeExp') fig.show() color 옵션에 colu.. 더보기
[plotly]scatter 그래프 그리기 plotly의 scatter를 이용해서 그래프를 그려보겠습니다. 라이브러리를 import하고 기본 제공 데이터중 experiment를 load했습니다. import plotly.express as px df=px.data.experiment() df.head() 기본 그래프를 그래는 방식은 data_frame지정, x축, y축을 지정하면 되고, 마지막에 fig.show()를 넣어주어야 그래프가 표시됩니다. fig=px.scatter(data_frame=df,x='experiment_1',y='experiment_2') fig.show() color 옵션에 column을 지정하면 그 column의 내용대로 색깔이 나뉘게 됩니다. color에 gender를 지정하면 male/female로 색 구분이 됩니다... 더보기
[seaborn] countplot 그래프 그리기 seaborn의 countplot을 이용해서 그래프를 그려보겠습니다. 라이브러리 import 및 데이터를 load합니다. seaborn내의 titanic 데이터를 load했습니다. import seaborn as sns sns.set_theme(style="whitegrid") df = sns.load_dataset("titanic") df 기본 count chart를 그리는 방식은 data지정 x축 데이터 선택을 하면 x축에 해당하는 개수만큼 표시가 됩니다. sns.countplot(data='data지정', x='x축 데이터') sns.countplot(data=df, x=df["class"]) class column내에는 First, Second, Third의 3가지 데이터가 있는데 각 몇개의 데이.. 더보기
[seaborn] scatterplot 그래프 그리기 seaborn의 scatterplot을 이용해서 그래프를 그려보겠습니다. 라이브러리 import 및 데이터를 load합니다. seaborn내의 tips 데이터를 load했습니다. import matplotlib.pyplot as plt import seaborn as sns sns.set_style("whitegrid") tips = sns.load_dataset("tips") tips.head() 기본 scatter chart를 그리는 방식은 data지정 x축 데이터 선택, y축 데이터 선택이 되겠습니다. sns.scatterplot(data='data지정', x='x축 데이터', y='y축 데이터) sns.scatterplot(data=tips, x="total_bill", y="tip") x축 to.. 더보기
[seaborn] lineplot 그래프 그리기 seaborn의 lineplot을 이용해서 그래프를 그려보겠습니다. 라이브러리 import 및 데이터를 load합니다. seaborn내의 flights 데이터를 load했습니다. import matplotlib.pyplot as plt import seaborn as sns sns.set_style("whitegrid") flights = sns.load_dataset("flights") flights.head() 1949~1960년 까지의 월별 승객수 데이터입니다. 기본 line chart를 그리는 방식은 data지정 x축 데이터 선택, y축 데이터 선택이 되겠습니다. sns.lineplot(data='data지정', x='x축 데이터', y='y축 데이터) flights_may=flights.loc[.. 더보기
[Python] DataFrame groupby 사용하기 DataFrame의 groupby의 사용법을 삼성전자 주가의 데이터로 확인해 보겠습니다. FinanceDataReader를 이용 데이터를 수집합니다. import FinanceDataReader as fdr code='005930' startdate='2020-01-01' df=fdr.DataReader(code,startdate) df['year']=df.index.strftime('%Y') df['month']=df.index.strftime('%m') df['yearmonth']=df.index.strftime('%Y%m') df.head() 연도별 평균데이터는 아래의 방법으로 확인이 가능합니다. df.groupby('year').mean() 연도별 (2020, 2021, 2022년)로 각 데이터(.. 더보기
[Python] dataframe의 pivot_table DataFrame의 pivot_table 사용에 대해서 알아보겠습니다. 데이터 수집 삼성전자 2022-01-01~2022-09-30 데이터를 수집했습니다. import pandas as pd import FinanceDataReader as fdr from IPython.display import display code='005930' startdate='2022-01-01' enddate='2022-09-30' df=fdr.DataReader(code,startdate,enddate) pivot_table에서 월별 집계를 하기 위해 년월의 정보로 column을 생성하겠습니다. df['yearmonth']=df.index.strftime('%Y%m') df pivot_table사용 이 중에서 values.. 더보기
[Python] DataFrame loc 원하는 조건의 데이터만 조회 DataFrame의 loc 을 이용해 원하는 조건의 데이터만 조회해 보겠습니다. 데이터 수집 finance datareader를 이용해 삼성전자 2022-09-01~09-30 데이터를 수집했습니다. import pandas as pd import FinanceDataReader as fdr from IPython.display import display code='005930' startdate='2022-09-01' enddate='2022-09-30' df=fdr.DataReader(code,startdate,enddate) 데이터 확인이 됩니다. loc 사용 Pandas의 API Reference의 내용입니다. df.loc[검색어]로 검색시에는 df.index 내의 검색어에 해당하는 결과를 보여줍니.. 더보기

반응형