Study16 Do it! 데이터 분석을 위한 판다스 입문 4장 04장 그래프 그리기 04-1 데이터 시각화가 필요한 이유 앤스콤 4분할 그래프: 데이터를 시각화하지 않고 수치만 확인할 때 발생할 수 있는 함정을 보여주기 위해 만든 그래프 데이터 집합은 4개의 그룹으로 구성, 모든 데이터 그룹은 x, y열을 가지고 있음 4개의 데이터는 각각 평균, 분산과 같은 수칫값이나 상관관계, 회귀선이 같다 위의 결과를 보고 '4개의 데이터 그룹의 데이터는 모두 같을 것이다'고 착각할 수 있음 >> 함정 하지만 데이터 그룹을 시각화하면 데이터 그룹이 서로 다른 데이터 패턴을 가지고 있다는 점을 금방 파악할 수 있음 앤스콤 데이터 집합은 seaborn 라이브러리에 포함되어 있음 >> load_dataset 메서드에 문자열 anscombe을 전달하면 앤스콤 데이터 집합을 불러올 수 .. 2023. 7. 5. Do it! 데이터 분석을 위한 판다스 입문 3장 03 판다스 데이터프레임과 시리즈 03-1 나만의 데이터 만들기 시리즈를 생성할 때 문자열을 인덱스로 지정 가능 >> Series 메서드의 index 인자를 통해 인덱스로 사용하고자 하는 문자열 리스트 전달 데이터프레임을 만들기 위해서는 딕셔너리를 DataFrame 클래스에 전달해야 함 데이터프레임에서 인덱스를 따로 지정하려면 index 인자에 리스트 전달 column 인자로 데이터프레임의 열 순서 지정 딕셔너리를 전달했어도 columns 인자로 다시 열 이름 전달하면 열 순서는 columns 값을 따라감 순서가 보장된 딕셔너리를 전달하려면 OrderedDict 클래스 사용 03-2 시리즈 다루기 (기초) 데이터프레임에서 시리즈를 선택하려면 loc 속성에 인덱스 전달 index 속성: 시리즈의 인덱스가 .. 2023. 6. 23. Do it! 데이터 분석을 위한 판다스 입문 2장 02 판다스 시작하기 02-1 데이터 집합 불러오기 판다스는 데이터를 효율적으로 다루기 위해 시리즈와 데이터프레임이라는 자료형 사용 데이터프레임이 엑셀 시트와 같은 개념이라하면 시리즈는 시트의 열 1개를 의미 데이터프레임은 시리즈들이 각 요소가 되는 딕셔너리와 마찬가지 read_csv 메서드: 데이터 집합을 읽어 들여와 데이터프레임이라는 자료형으로 반환 shape: 데이터프레임의 행과 열 크기 저장 columns: 데이터 프레임의 열 이름 확인 데이터프레임을 구성하는 값의 자료형은 데이터프레임의 dtypes 속성이나 info 메서드로 확인 가능 (print(df.columns), print(df.info())) 판다스 자료형 vs 파이썬 자료형 판다스 자료형 파이썬 자료형 설명 object string .. 2023. 6. 23. 깃&깃허브 스터디 (11주차) 깃허브의 새로운 서비스와 기능 클라우드에서 개발 - 코드스페이스와 깃허브 데브 코드스페이스 개발 환경을 온라인으로 옮겨놓은 것 사용 시간과 저장 공간에 대해 비용이 청구됨 깃허브 프로인 개인 계정에서 무료로 사용 가능 깃허브 데브 웹 브라우저에서 VS Code를 열어 저장소의 소스를 수정할 수 있으며 깃허브에 다시 푸시 가능 VS Code를 설치할 수 없는 장치에서도 접속 후 소스 작성 가능 AI에 기반한 소스 추천 서비스 - 코파일럿 코파일럿 AI를 사용해서 소스를 자동으로 추천해주는 프로그램 주석을 이해하고 소스 코드로 변환 개발 과정에서 자주 사용되는 소스 제시 출처 : Do it! 지옥에서 온 문서 관리자 깃&깃허브 입문 (이고잉 지음) http://www.yes24.com/Product/Good.. 2023. 5. 27. 이전 1 2 3 4 다음