데이터 분석 프로젝트를 준비하면서, 연습하고 유용하게 쓸만한 다양한 데이터를 찾으려 했는데 사이트가 엄청 많았다. 다양한 데이터를 찾는게 데이터 분석에서 중요하다는 생각에, 공모전과 공개 데이터 사이트들을 찾아봤다. 이 글에서는 그 중에서 도움이 될 만한 사이트들을 정리하려 한다.
공개 데이터 사이트
이름 | 링크 | 설명 | |
공공 | AI HUB | https://aihub.or.kr/ | 한국에서 데이터들이 다양하게 제공됨. 다양한 분야의 데이터셋을 다룰 수 있다. |
공공 | 공공 데이터 포털 | https://www.data.go.kr/ | 한국의 공공 데이터들을 모아둔 사이트. 데이터는 부족할 수 있고, 딥러닝에는 적합하지 않으며, 머신러닝에 한계가 있음. |
공공 | 서울 열린 데이터광장 | https://data.seoul.go.kr/ | 서울시의 다양한 공공 데이터를 제공하는 플랫폼. |
공공 | 국립국어원 말뭉치 | https://corpus.korean.go.kr/ | 검증된 한국어 데이터셋을 제공. 출처를 여러 곳에서 가져와 데이터 품질이 좋다. |
공공 | 한국도로공사 오픈오아시스 | http://data.ex.co.kr/ | 도로와 관련된 다양한 데이터를 제공. |
공공 | 보건의료 빅데이터 개방시스템 | https://opendata.hira.or.kr/home.do | 보건의료 관련 빅데이터를 제공하는 사이트. |
공공 | 전력 빅데이터 센터 | https://bigdata.kepco.co.kr | 전력 관련 빅데이터를 제공. |
공공 | 경기데이터드림 | https://data.gg.go.kr/portal/mainPage.do | 경기도의 다양한 공공 데이터를 제공. |
공공 | 농림축산식품 공공데이터포털 | http://data.mafra.go.kr/ | 농림축산식품 관련 공공 데이터를 제공하는 사이트. |
공공 | 경기통계 | https://stat.gg.go.kr/statgg/ | 경기도의 통계 데이터를 제공. |
공공 | 국가통계포털 | http://kosis.kr/ | 대한민국의 통계 데이터를 제공하는 국가 통계 포털. |
공공 | e-나라지표 | https://www.index.go.kr/ | 다양한 국가 지표를 제공하는 사이트. |
공공 | ALIO | https://alio.go.kr/ | 공공기관의 열린 데이터들을 제공하는 플랫폼. |
공공 | 국가공간정보포털 | http://www.nsdi.go.kr/ | 공간 정보 관련 데이터를 제공. |
공공 | TourAPI | http://api.visitkorea.or.kr/ | 관광 관련 API를 제공하는 플랫폼. |
공공 | K-ICT 빅데이터센터 | https://kbig.kr/portal/kbig | ICT 관련 빅데이터를 제공. |
공공 | KAMP | https://www.kamp-ai.kr/ | 중소기업의 인공지능 제조 데이터셋과 분석 도구를 제공. |
민간 | 데이터스토어 | https://www.datastore.or.kr/ | 다양한 민간 데이터를 제공하는 플랫폼. |
민간 | 빅카인즈 | https://www.bigkinds.or.kr/ | 언론 매체의 뉴스 데이터를 제공. |
민간 | 문화 빅데이터 플랫폼 | http://www.bigdata-culture.kr/bigdata/ | 문화 관련 빅데이터를 제공. |
민간 | 데이콘 | https://dacon.io/ | 한국판 Kaggle, 기업/기관으로부터 데이터를 받아 경진대회를 여는 플랫폼. |
민간 | UCI Machine Learning Repository | https://archive.ics.uci.edu/ml | 머신러닝 분석 연습에 적합한 데이터셋을 제공하는 고전적인 플랫폼. |
민간 | 캐글 | https://www.kaggle.com/datasets | 다양한 분야의 실제 데이터를 제공하는 유명한 데이터 분석 플랫폼. |
민간 | Papers with Code | https://paperswithcode.com/datasets | 코드, 데이터 등을 무료로 제공하는 사이트. |
도움
https://calmmimiforest.tistory.com/2
[데이터 분석]데이터 공개 사이트 목록
** 데이터 분석 시 활용할 만한 데이터셋 모음 ** 데이터 분석 연습을 위한 공모전 데이터와 실전 분석에서 Feature로 활용할 수 있는 공개 데이터에 대한 사이트 목록입니다. [공모전 데이터] 이름
calmmimiforest.tistory.com
데이터를 얻을 수 있는 사이트
https://aihub.or.kr/어마어마한 돈을 들여 만든 데이터들다양한 데이터들이 많다.https://www.data.go.kr/우리나라의 여러 공공데이터들을 모아둠데이터가 조금 빈약함 -> 딥러닝은 X, 머신러닝은 간당간당
velog.io
'Memo' 카테고리의 다른 글
[Memo] Anaconda 가상환경 자주 쓰는 명령어 정리 (2) | 2024.12.26 |
---|---|
[Memo] 리눅스 (Linux) vi 편집기 명령어 35개 정리 (1) | 2024.03.27 |
[Memo] 유닉스 (Unix) / 리눅스 (Linux) 자주 쓰는 명령어 50개 정리 (1) | 2024.03.26 |