일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- select_related()
- find_all()
- to_excel
- findall()
- read_table
- 코딩생활
- pivot_table
- read_excel
- 강남데이트
- iloc
- TensorFlow
- 웹스크랩
- pandas
- read_csv
- find()
- webscrap
- to_html
- select_one()
- read_fwf
- 강남 녘
- groupby
- topic생성
- Join
- kafka설치
- to_json
- 갈비스테이크
- 녘
- DataFrame
- to_csv
- keras
- Today
- Total
목록전체 글 (9)
자드's

DataFrame : File input / output 작성한 DataFrame을 파일로 저장하거나 작성된 파일을 불러와서 DataFrame으로 저장하는 일은 데이터 분석에서 필수 업무 중의 하나이다 오늘은 몇몇 형태의 파일을 불러오거나 저장하는 방법을 알아보자 CSV(.csv)파일 불러오기 : read_csv( ) pandas.read_csv( ' 경로 ' ) 형식으로 사용이 가능하다 편의상 pandas를 pd로 축약해서 쓰고있다 import pandas as pd from pandas.tests.frame.methods.test_sort_values import ascending df = pd.read_csv("../testdata/ex1.csv") print(df,type(df)) print() ..

Pandas의 기능들 이번 글은 Pandas의 기능들에 대해서 몇가지 알아보려고 한다 먼저 Series와 DataFrame의 재구조 및 기술적 통계와 관련된 함수 DataFrame의 범주화 및 병합을 알아보자 Series 와 DataFrame의 재구조 Series의 재색인, 재배치 index를 재배치 하면 그에 맞는 value도 재배치가 된다 reindex( )를 하면서 index의 갯수를 늘려주면 value에는 NaN이 채워진다 import pandas as pd import numpy as np # Series의 재 색인 data = pd.Series([1,3,2], index=(1,4,2)) # index는 list, tuple, set 가능 # reindex()로 순서를 재 배치 data2 = d..

Pandas란? 파이썬 초기 설치시에 아나콘다를 설치했기 때문에 Pandas 라이브러리가 설치되어있었다 Pandas의 특징으로는 고수준의 자료구조(Series, DataFrame)와 빠르고 쉬운 데이터 분석용 자료구조 및 함수를 제공 NumPy의 고성능 배열 계산 기능과 스프레드시트 SQL과 같은 RDMBS의 유연한 데이터 조작 기능 쉽게 데이터를 재배치하여 집계 등 처리의 편리함 등등이다. Series Series 객체의 특징을 몇가지 알아보자 1. 순서가 있는 Data type만 가능하다. #먼저 pandas 라이브러리에 있는 Series 객체 사용을 위해 import를 한다 import pandas as pd from pandas import Series # Series는 일련의 객체를 담을 수 있..

오늘의 복습 선형회귀분석 말부터 어렵다 다가오질 않는다... 선형성 직선처럼 똑바른 도형, 또는 그와 비슷한 성질을 갖는 대상이라는 뜻으로, 이러한 성질을 갖고 있는 변환 등에 대하여 쓰는 용어이다. 함수의 경우, 어떠한 함수가 진행하는 모양이 '직선'이라는 의미로 사용된다. 이러한 개념은 수학, 물리학 등에서 많이 사용된다. ...위키 백과 발췌 내용인데 대충 느낌이 균일하게 진행되는 느낌 선형회귀분석이란? 두 변수간에 상관관계와, 인과관계가 있는경우 두 변수를 선형함수식으로 모델링하는 분석방법이라고 함 이를 하기 위해선 몇가지 알고 넘어가야 할 것 같다 독립변수, 종속변수, 상관계수 등... 먼저 독립변수와 종속변수는 원인과 결과 상관계수란 두 변수 사이의 인과 관계를 숫자로 나타낸 값 이란다 (머신..