본문 바로가기

엑셀 크롤링6

엑셀 크롤링6. 셀레니움(Selenium)과 VBA로 특정 웹사이트 조작하기 1. 셀레니움(Selenium)과 VBA로 특정 웹사이트 조작하는 방법 이전 포스팅에서는 셀레니움의 소개와 크롬 드라이버의 업데이트 방법, 설치방법 등을 설명드렸는데요. 이번에는 본격적으로 셀레니움을 활용한 특정 웹사이트의 자동 조작방법을 알려드리겠습니다. 먼저 셀레니움을 설치한 후 크롬드라이버의 버전에 맞게 업데이트하는 준비작업이 필요하므로 해당 내용은 하기 포스팅을 참고 부탁드립니다. 엑셀 크롤링4. 셀레니움 크롬 드라이버 업데이트 방법 (tistory.com) 첫번째로 엑셀파일을 열고 난후 Art+F11을 눌러 VBA 창에 진입하여, 모듈을 하나 추가합니다. 그리고 VBA창에서 도구→참조 버튼을 눌러서 참조 창에서 "Selenium Type Library"를 추가해줍니다. 셀레니움을 제대로 설치하셨.. 2024. 3. 7.
엑셀 크롤링5. 엑셀 VBA 셀레니움(Selenium)의 프레임 전환 방법 1. HTML의 프레임이란? 엑셀 VBA 셀레니움으로 전환이 가능할까? HTML에서 프레임(Frame)은 웹 페이지를 여러 개의 독립적인 영역으로 분할하여 각 영역에 다른 웹 페이지를 표시하는 데 사용됩니다. 이것은 기존의 단일 페이지 구조를 벗어나 여러 개의 페이지를 하나의 페이지 안에서 표시할 수 있도록 해줍니다. HTML의 프레임은 , , 등의 요소로 표현됩니다. 프레임을 사용하면 한 웹 페이지 안에서 여러 개의 독립적인 문서를 표시할 수 있으므로, 네비게이션 메뉴나 사이트의 일부를 고정시키거나 다른 웹 사이트를 삽입하는 등의 다양한 사용 방법이 있습니다. 하지만 프레임을 사용할 때에는 검색 엔진 최적화(SEO)나 웹 접근성 등을 고려하여야 합니다. 최근에는 프레임보다는 CSS를 사용하여 레이아웃을.. 2024. 2. 20.
엑셀 크롤링4. 셀레니움 크롬 드라이버 업데이트 방법 1. 셀레니움 크롬 드라이버 불일치로 인한 에러발생 지난 포스팅에서 셀레니움의 설치방법 및 다운로드 경로, 설치 경로를 확인하는 방법을 알려드렸습니다만, 셀레니움은 VBA, Python등의 다른 프로그래밍 언어로 조합되어서 인터넷 브라우저(크롬, 엣지 등)를 자동으로 제어하는 Tool로 사용됩니다. 하지만 초기 셀레니움 설치 후에는 현재 자신이 사용하는 인터넷 브라우저와 셀레니움 설치경로에 있는 해당 브라우저의 드라이버 버전을 일치화시켜줘야 제대로 실행시킬 수 있습니다. 셀레니움을 설치하고, 프로그래밍으로 특정 URL을 크롬으로 열었을때(크롬으로 예를 들겠습니다만, 다른 브라우저도 동일합니다) 만약 하기와 같은 에러가 발생한다면 현재 자신이 사용중인 크롬 드라이버와 셀레니움의 크롬 드라이버가 버전이 다르.. 2024. 1. 28.
엑셀 크롤링3. 셀레니움 크롤링 기초 VBA 세팅 1. 셀레니움을 통한 크롤링 기초 세팅 지난 포스팅에서 설명드린 셀레니움의 설치방법 및 세팅방법을 알려드리겠습니다. 먼저 셀레니움은 무료로 설치가능하며 셀레니움을 설치한 후 엑셀의 VBA와 연동하여 코드를 작성하는 것으로, 크롬(Chrome), 엣지(Edge)등의 웹브라우저를 직접 열거나 클릭하는 과정을 자동화 할 수 있습니다. 설치방법입니다. ① 먼저 아래 사이트를 클릭합니다. (새창으로 열립니다) https://github.com/florentbr/SeleniumBasic ② 우측에 있는 Selenium Basic v2.0.9.0을 클릭합니다. ③ 그러면 하기와 같은 창으로 이동됩니다만, 여기서 SeleniumBasic-2.0.9.0.exe를 클릭하면 다운로드됩니다. ④ 다운로드 된 파일을 실행시켜주.. 2024. 1. 27.
엑셀 크롤링2. 파워쿼리로 비트코인 시세 크롤링(가장 쉬움) 1. 엑셀에서 파워쿼리로 비트코인 시세 크롤링을 하는 방법 이전 포스팅에서 엑셀을 이용한 크롤링의 종류를 개략적으로 소개했습니다만, 이번 포스팅에서는 실제로 엑셀의 파워쿼리라는 기본기능을 사용해 비트코인 사이트에서 시세표를 크롤링해보겠습니다. 하기 이미지처럼 해당 사이트의 가상화폐 시세표를 엑셀로 받아와서 자동으로 표시하며 엑셀에서 갱신버튼만 누르면 자동으로 해당 사이트의 내용이 엑셀에서도 반영되는 크롤링 시스템을 만들어보겠습니다. 매우 쉽습니다. 먼저, 파워쿼리로 크롤링을 하기 위해서는 이하 순서와 같이 따라해주세요. ● 파워쿼리로 비트코인 시세 크롤링 순서 ① 엑셀을 열고 이하 이미지처럼 데이터 탭에서 "웹"을 클릭, URL 부분에 하기 사이트 URL을 넣고 확인을 눌러주세요. (*비트코인 시세 사이.. 2024. 1. 26.
엑셀 크롤링1. 엑셀로 웹크롤링을 하는 방법(기초) 1. 웹크롤링이란? 웹 크롤링(Web Crawling)이란 인터넷 상에 존재하는 웹 페이지들을 자동으로 탐색하여 정보를 수집하는 자동화 과정입니다. 다른 말로 웹 스크래핑(Web Scraping)이라고도 불립니다. 웹 크롤링은 대부분의 경우 웹 데이터를 수집하거나 분석하기 위해 사용됩니다. 웹 크롤링의 주요 목적은 하기와 같습니다. 웹 크롤링 목적: 데이터 수집: 웹상의 다양한 정보를 수집하여 엑셀 등과 같은 누적 관리 시트에 자동으로 축적할 수 있습니다. 검색 엔진: 특정 검색엔진을 만들어 웹상의 정보를 자동 수집하여 사용자가 필요한 형태로 가공할 수 있습니다. 가격 비교: 상품의 가격이나 정보를 수집하여 다양한 온라인 상품 비교 사이트에 활용합니다. 뉴스 및 블로그 모니터링: 특정 키워드나 주제에 대.. 2024. 1. 25.
반응형