[R] KOSPI/KOSDAQ 전 종목 데이터 수집 및 관리

대한민국의 모든 주식 정보를 내 손 안에 가져올 수 있다? 자동으로 가져올 수 있는데 모르셨어요?

클래스 소개
난이도
보통
카테고리
프로그래밍 - 데이터 추출/분석
태그
데이터 분석, 데이터베이스, R
수료증
발급 가능
추천 학습대상
- R을 기본적으로 할 줄 아시는 분
- 주식데이터를 필요로 하시는 분
- 투자를 하기 위한 기초 데이터를 쌓고 싶으신 분
- 크롤링에 대한 기본 지식을 가지고 계신 분


매일 수 많은 희노애락이 오가는 증권시장,
숨겨져 있는 작은 단서까지 파헤치고 싶나요?



주가 수집부터 트렌드 파악까지


증권시장에 상장되어 있는 모든 종목을 수집하고
관리하는 방법, 궁금하시죠?

매일 자동으로 새 주가 정보를 수집하고 업종별 종목
트렌드까지 파악
하는 Dashboard를 만들 수 있다면?




여러분의 시간은 소중하니까


이 강좌를 수강하실 여러분은 오늘부터 우리나라
주식시장에 상장된 모든 종목을 수집 및 관리하는
자동화 프로그램을 만들어 볼 겁니다

시간 관계상 강좌에서는 최근 3년치 데이터만 수집하지만,
숫자만 바꾸면 아주 쉽게 10년치 데이터를 수집할 수 있고
앞으로 새로 발생할 데이터도 계속 모을 수 있습니다

이 강좌를 완강한다면 자동화를 통해 주식시장 거래가
완료되는 오후 4시쯤 당일 거래된 모든 데이터를
바로 확인할 수 있게 될 겁니다

제작 결과 미리보기 (클릭)

p.s. 일정 인원 접속시 접속이 지연될 수 있습니다



이런 내용들을 배웁니다


종목 코드 받아오기

주식시장에 상장된 회사, 즉 종목들은 모두 고유 코드를
갖고 있으며, 이 코드에 따라 크롤링하는 주소가 달라집니다

때문에 각 회사별 고유 코드를 먼저 수집해야 하죠


이 강좌에서는 네이버 금융에서 고유 코드를
가져올 수 있도록 코드에 대한 전처리를 진행합니다


전체 주식 종목 수집

각 종목별 네이버 금융 주소를 세팅한 뒤 전 종목에 대해
최근 3년치 데이터를 수집할 겁니다

3년치를 기준으로 약 4시간이 소요되었으니
10년치는 12시간 정도면 수집이 완료될 겁니다

또한 종목별 주식 일일 데이터를 수집한 후 각 종목별
폴더를 생성해 저장하는 방법과 에러가 발생할 때를
대비한 예외처리까지 진행하려 합니다


일별 주식 수집 자동화

이렇게 매일 10년치 데이터를 긁어올 순 없겠죠?

만약 그랬다간 시간만 낭비하고 컴퓨터는 불이 날 겁니다..


당일 주식 거래가 끝나는 오후 4시마다 일일 주식 데이터
 수집한 뒤 기존에 저장되어 있던 데이터에 합치는 방식의
자동화를 진행
하려 합니다


업종별 트렌드 파악 및 DashBoard 제작

중장기적 주식 투자 관점으로 보면 업종 및 테마별
트렌드를 파악하는 것이 매우 중요합니다


업종별 주식 종목 코드를 수집하고, 이 종목들에 대한
데이터를 불러와 트렌드를 파악한 뒤 시각화까지
진행해 봅시다

물론, 이 과정도 자동화할 겁니다










'구만사'가 직접 들어봤다👀




나한테 맞는 강좌일지 고민하는 분들을 위해
구름을 만드는 사람들이 먼저 들어봤어요!



이런 분에게 꼭 필요해요

👉 코드 맥락에 대한 꼼꼼한 설명을 원한다 Pick!
👉 딱 하루만 투자해서 내일부터 내게 필요한
주식 데이터를 모두 수집하고 싶다
면 Pick!
👉 실존하는 데이터의 분석법이 궁금하다면 Pick!



한 번 더 고민해주세요

🤔 강의 음질에 민감하신 분이라면 Hmm...
🤔 R 기반의 데이터분석이 익숙치 않다면 Hmm...










크롤링과 텍스트마이닝이 취미👍


코코

학부에서 통계학을 전공한 뒤 현재 산업공학
대학원에서 인공지능을 공부하는 박사과정생입니다

주 연구 분야는 데이터 사이언스, 강화학습, 딥러닝이며,
크롤링과 텍스트마이닝을 취미로 하고 있습니다:)

크롤링을 이용해 인기 커뮤니티 글을 수집해 보여주는
'마롱'이라는 앱을 개발했고, 전국 맛집 리스트와 블로그를
수집해서 맛집 추천 앱도 만들었죠 (시원하게 말아먹...)


수상 이력

2018 제6회 빅콘테스트 엔씨소프트상
- 게임유저이탈 알고리즘 개발

2017 제5회 빅콘테스트 한국정보통신진흥협회장상
- 대출 연체자 예측 알고리즘 개발

2016 날씨 빅데이터 콘테스트 기상산업진흥원장상

2016 제4회 빅콘테스트 본선진출
- 보험사기 예측 알고리즘 개발

2015 제3회 빅콘테스트 미래창조과학부 장관상
- 야구 경기 예측 알고리즘 개발


제 블로그에 놀러오세요!


 

all Icon made by Freepik from www.flaticon.com

체험하기
모두 펼치기
  • 01
    Section0. 오리엔테이션
  • 오리엔테이션
  • 02
    Section1. 전체 주식 종목 수집하기
  • 한국거래소에서 종목 코드 받아오기
    종목 코드 전처리 작업1
교육 과정
모두 펼치기
  • 01
    Section0. 오리엔테이션
  • 오리엔테이션
    강의자료 다운로드
  • 02
    Section1. 전체 주식 종목 수집하기
  • 한국거래소에서 종목 코드 받아오기
    종목 코드 전처리 작업1
    종목 코드 전처리 작업2
    웹 크롤링 입문: 네이버 증권 크롤링1
    웹 크롤링 입문: 네이버 증권 크롤링2
    주식시장 전체 상장 주식 크롤링
    Try-error문을 통한 예외처리
  • 03
    Section2. 일별 주식 수집 자동화하기
  • 일별 주식 수집 자동화1
    일별 주식 수집 자동화2
    일별 주식 수집 자동화3
    원하는 종목 추출 및 비교
  • 04
    Section3. 업종별 주식 트렌드 파악
  • 업종 정보 수집
    업종별 주식 종목 트렌드 파악
    업종별 주식 종목 정리
    업종별 주식 시각화1
    업종별 주식 시각화2
    전 과정 자동화
  • 05
    Section4. Shiny를 통한 dashboard 제작
  • Shiny 기초
    Shiny를 통한 업종별 트렌드 대시보드 제작1
    Shiny를 통한 업종별 트렌드 대시보드 제작2
    Shiny를 통한 업종별 트렌드 대시보드 제작3 및 자동화
마지막 업데이트|2020년 05월 22일
강의자 소개
안녕하세요. 구름에듀 캡틴 코코입니다. 함께 학습을 시작해봐요!

강좌 후기
55,000

평균평점
4.0
난이도
보통
수강기간
평생 무제한