[Memo] 분석에서 활용할 수 있는 공개 데이터 사이트 모음

2025. 2. 18. 19:44·Memo

데이터 분석 프로젝트를 준비하면서, 연습하고 유용하게 쓸만한 다양한 데이터를 찾으려 했는데 사이트가 엄청 많았다. 다양한 데이터를 찾는게 데이터 분석에서 중요하다는 생각에, 공모전과 공개 데이터 사이트들을 찾아봤다. 이 글에서는 그 중에서 도움이 될 만한 사이트들을 정리하려 한다.

 

공개 데이터 사이트

  이름 링크 설명
공공 AI HUB https://aihub.or.kr/ 한국에서 데이터들이 다양하게 제공됨. 다양한 분야의 데이터셋을 다룰 수 있다.
공공 공공 데이터 포털 https://www.data.go.kr/ 한국의 공공 데이터들을 모아둔 사이트. 데이터는 부족할 수 있고, 딥러닝에는 적합하지 않으며, 머신러닝에 한계가 있음.
공공 서울 열린 데이터광장 https://data.seoul.go.kr/ 서울시의 다양한 공공 데이터를 제공하는 플랫폼.
공공 국립국어원 말뭉치 https://corpus.korean.go.kr/ 검증된 한국어 데이터셋을 제공. 출처를 여러 곳에서 가져와 데이터 품질이 좋다.
공공 한국도로공사 오픈오아시스 http://data.ex.co.kr/ 도로와 관련된 다양한 데이터를 제공.
공공 보건의료 빅데이터 개방시스템 https://opendata.hira.or.kr/home.do 보건의료 관련 빅데이터를 제공하는 사이트.
공공 전력 빅데이터 센터 https://bigdata.kepco.co.kr 전력 관련 빅데이터를 제공.
공공 경기데이터드림 https://data.gg.go.kr/portal/mainPage.do 경기도의 다양한 공공 데이터를 제공.
공공 농림축산식품 공공데이터포털 http://data.mafra.go.kr/ 농림축산식품 관련 공공 데이터를 제공하는 사이트.
공공 경기통계 https://stat.gg.go.kr/statgg/ 경기도의 통계 데이터를 제공.
공공 국가통계포털 http://kosis.kr/ 대한민국의 통계 데이터를 제공하는 국가 통계 포털.
공공 e-나라지표 https://www.index.go.kr/ 다양한 국가 지표를 제공하는 사이트.
공공 ALIO https://alio.go.kr/ 공공기관의 열린 데이터들을 제공하는 플랫폼.
공공 국가공간정보포털 http://www.nsdi.go.kr/ 공간 정보 관련 데이터를 제공.
공공 TourAPI http://api.visitkorea.or.kr/ 관광 관련 API를 제공하는 플랫폼.
공공 K-ICT 빅데이터센터 https://kbig.kr/portal/kbig ICT 관련 빅데이터를 제공.
공공 KAMP https://www.kamp-ai.kr/ 중소기업의 인공지능 제조 데이터셋과 분석 도구를 제공.
민간 데이터스토어 https://www.datastore.or.kr/ 다양한 민간 데이터를 제공하는 플랫폼.
민간 빅카인즈 https://www.bigkinds.or.kr/ 언론 매체의 뉴스 데이터를 제공.
민간 문화 빅데이터 플랫폼 http://www.bigdata-culture.kr/bigdata/ 문화 관련 빅데이터를 제공.
민간 데이콘 https://dacon.io/ 한국판 Kaggle, 기업/기관으로부터 데이터를 받아 경진대회를 여는 플랫폼.
민간 UCI Machine Learning Repository https://archive.ics.uci.edu/ml 머신러닝 분석 연습에 적합한 데이터셋을 제공하는 고전적인 플랫폼.
민간 캐글 https://www.kaggle.com/datasets 다양한 분야의 실제 데이터를 제공하는 유명한 데이터 분석 플랫폼.
민간 Papers with Code https://paperswithcode.com/datasets 코드, 데이터 등을 무료로 제공하는 사이트.

도움

https://calmmimiforest.tistory.com/2

 

[데이터 분석]데이터 공개 사이트 목록

** 데이터 분석 시 활용할 만한 데이터셋 모음 ** 데이터 분석 연습을 위한 공모전 데이터와 실전 분석에서 Feature로 활용할 수 있는 공개 데이터에 대한 사이트 목록입니다. [공모전 데이터] 이름

calmmimiforest.tistory.com

 

https://velog.io/@hunterhunter/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A5%BC-%EC%96%BB%EC%9D%84-%EC%88%98-%EC%9E%88%EB%8A%94-%EC%82%AC%EC%9D%B4%ED%8A%B8

 

데이터를 얻을 수 있는 사이트

https://aihub.or.kr/어마어마한 돈을 들여 만든 데이터들다양한 데이터들이 많다.https://www.data.go.kr/우리나라의 여러 공공데이터들을 모아둠데이터가 조금 빈약함 -> 딥러닝은 X, 머신러닝은 간당간당

velog.io

 

'Memo' 카테고리의 다른 글

[Memo] Anaconda 가상환경 자주 쓰는 명령어 정리  (2) 2024.12.26
[Memo] 리눅스 (Linux) vi 편집기 명령어 35개 정리  (1) 2024.03.27
[Memo] 유닉스 (Unix) / 리눅스 (Linux) 자주 쓰는 명령어 50개 정리  (1) 2024.03.26
'Memo' 카테고리의 다른 글
  • [Memo] Anaconda 가상환경 자주 쓰는 명령어 정리
  • [Memo] 리눅스 (Linux) vi 편집기 명령어 35개 정리
  • [Memo] 유닉스 (Unix) / 리눅스 (Linux) 자주 쓰는 명령어 50개 정리
임승택
임승택
"Hello, I am Im Seungtaek, a computer engineering student. Nice to meet you!"
  • Lim's Technology
    임승택
    임승택
    "Welcome to Lim's Technology!"
  • 누적 조회수
    총 회
    구독하기
    • 분류 전체보기 (66)
      • Blog (1)
      • Computer Vision (34)
        • Computer Vision (2)
        • Paper reviews (16)
        • Project (9)
        • Basic (7)
      • LLM (8)
        • Paper reviews (3)
        • Project (3)
        • Basic (2)
      • Data Analysis (7)
        • Basic (7)
      • Robotics (5)
        • Paper reviews (3)
        • Basic (2)
      • Technology Notes (7)
      • Memo (4)
  • 인기 글

  • 최근 댓글

  • 최근 글

임승택
[Memo] 분석에서 활용할 수 있는 공개 데이터 사이트 모음
상단으로

티스토리툴바