이 글에서는 가장 많이 사용하는 데이터 형태인 '데이터 프레임'에 대하여 알아보겠습니다.
성별 |
학점 |
전공 |
여자 |
4.2 |
심리 |
남자 |
2.6 |
사회 |
남자 |
3.8 |
경영 |
위 표에서 열은 성별, 학점, 전공으로 세 가지 속성으로 되어 있고, 행으로는 총 세 명의 자료이므로 3개의 열과 행으로 구성된 데이터 프레임이라는 것을 알 수 있습니다.
"데이터가 크다"라는 표현은 행이 많거나 열이 많다는 의미인데 데이터를 분석하는 입장에서 봤을 때 열이 많은 것이 더 중요합니다.
행이 많아졌을 때 발생하는 문제로는 컴퓨터가 느려질 수 있다는 것입니다. 해결 방법은 고사양 장비를 구축하는 것입니다.
열이 많아졌을 때 발생하는 문제로는 변수를 조합할 수 있는 경우의 수가 늘어나 분석 방법의 한계가 생긴다는 것입니다. 해결 방법은 고급 분석 방법을 도입하는 것입니다.
이 글은 다음 책을 참고하여 작성했습니다.
김영우 Do it! 쉽게 배우는 R 데이터 분석 이지스퍼블리싱 2017
Do it! 쉽게 배우는 R 데이터 분석
통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을
book.naver.com
'Data > R' 카테고리의 다른 글
[R] 캐글(Kaggle) 데이터 분석하기 'marvel-wikia-data' (0) | 2019.06.15 |
---|---|
[R] R 스튜디오 설명서 (0) | 2019.04.08 |
[R] R(R 스튜디오) 설치 (0) | 2019.04.07 |
[R] R이란? (0) | 2019.04.06 |