반응형
"김대리. 오늘은 네이버 금융을 크롤링 하는 거지?"
"예. 맞습니다. 오늘은 네이버금융 페이지(https://finance.naver.com/)에 보시면, 오른쪽 하단에 보면
'인기 검색 종목' 보이시죠. 이게 증권 종목 중에 검색량이 많은 TOP 5를 보여주고 있어요."
"오~~. 여기 보니, 내가 가지고 있는 삼성전자도 나오고 있네.
음~! 여기에 나타나는 종목은 사람들에게 관심이 많다고 봐도 되겠네."
"예. 맞습니다. 여기에 나타나는 종목은 관심 TOP 이죠.
이거 크롤링 해 보죠. 재밌겠죠."
"맞아. 이거 재밌겠어. 만약 이 데이터를 매일 또는 매시간 수집해 두면 사람들이 관심가지는 종목을 모니터링 해 볼 수 있겠네."
"윽, 그거 좋은 방향입니다. 데이터를 매일 수입하고 분석한다면, 여론의 쏠림을 알 수 있을 것 같아요.
팀장님, 먼저 데이터 수집부터 해 보죠."
"오케이"
"먼저 웹페이지 분석부터 해 볼께요. 파싱을 위해서 먼저 웹페이지를 관찰하고 분석해 보면 실제 개발 시 많은 도움이 되거 든요.
먼저 https://finance.naver.com/ 링크에 들어가 보죠.
예. 좋아요. 거기서 F12 를 눌러서 개발자기능으로 들어가 보세요.
거기서 우측상단에 있는 '사각형+화살표'를 눌러서 '1.삼성전자..'가 나오는 블럭에 가져가 보세요.
예. 거기 사각형 블록이 잡히죠.
우측에 보면 <table..>이 있는 부분.
예, 거기.
바로 거기서 시작해 보면 되겠어요.
이제 쥬피터노트북으로 코딩하면서 볼께요."
반응형