kaggle(캐클)
2010년에 설립된 데이터 분석 경진대회 플랫폼
참고문헌:
캐글가이드(사카모토 도시유키 저, 박광수 옮김, 동양북스)
Kaggle 우승작으로 배우는 머신러닝 탐구생활(정권우 지음, 비제이퍼블릭)
www.kaggle.com
(1) www.kaggle.com 접속 메뉴 살펴보기
우선 메뉴를 보면 다음과 같습니다.
[Compete] [Datasets] [Notebooks] [Discuss] [Courses]
... [Jobs] [User Rankings] [Tags [Blog] [Documentation] [Progression] [Host a Competition] [Support/Contact]
[Team] [Teams] [Privacy]
메뉴 살펴보기
[Compete]
[Datasets]
각종 데이터셋을 다운로드 할 수 있는 곳, 2020-10-06 현재 55,919개 데이터셋
[Notebooks]
Code 를 구할 수 있는 곳, Python, R, SQLite, Julia
[Discuss]
Kaggle Forum
Getting Started
Product Feedbacj
[Courses] : 교육 과정
Python
Intro to Machine Learning
Intermediate Machine Learning
Data Visualization
Pandas
Feature Engineering
Deep Learning
Intro SQL
Anvanced SQL
Geospatial Analysis
Microchallenges
Machine Learning Explanability
Natural Language Processing
Intro to Game AI and Reinforcement Learining
Data Cleansing
[Jobs] : 일자리
... [Jobs] [User Rankings] [Tags [Blog] [Documentation] [Progression] [Host a Competition] [Support/Contact]
[Team] [Teams] [Privacy]
(2) 메뉴의 첫번째[ Compete] - 진행되고 있는 경진 대회
(3) 화면 중간, 오른쪽에 있는 [All Categories] 를 클릭 -> Getting Started 클릭
유명한 Titanic: Machine Learing from Disaster 가 나타납니다.
(4) Titanic 에 대한 안내가 나옵니다...
How to Get Started with Kaggle’s Titanic Competition | Kaggle 동영상
메뉴 [Overview] [Data] [Notebooks] [Discussion] [Leaderboard] [Rules]
[Team] [My Submissions] [Submit Predictions]
(5) 메뉴 [Data] 를 눌러서 데이터 다운로드
gender_submission.csv
test.csv
train.csv
gender_submission.csv
train.csv
test.csv
(6) 메뉴 [Notebooks] 를 눌러서 실제 코드 다운로드 - 언어 선택
화면 가운데 [Languages] 클릭 - Python R SQLite Julia
[Search Notbooks] - "titanic" 검색
R 언어로 제출된 것중에서 Titanic에 관련된 것만 추출
random forest, gpu, logistic regression, svm, decision tree 등 각종 기법을 적용하여 제출된 내용들이 보입니다.
(7) 실제 사례 선택 - 클릭
이 중에서 Titanic Analysis with R 을 선택해 봅니다.
R 코드를 실행해 봅니다.
그리하면 해당 소스를 볼 수 있습니다,. 제일 아래로 가면 Code 를 볼 수 있습니다.