본문 바로가기

JJUNNAK's

검색하기
JJUNNAK's
프로필사진 최낙준

  • Develop (59)
    • PROJECT (12)
      • Smart Mirror (6)
      • 급똥 (5)
      • 오늘 뭐 먹지? (1)
    • 코딩 테스트 (8)
    • Language (17)
      • Java (4)
      • R (13)
    • TroubleShooting (3)
    • DB (1)
      • MySQL (1)
    • Git | Github (3)
    • Android (7)
    • Crawling (7)
    • Memo (1)
Guestbook
Today
Total
Notice
  • 블로그 이사 왔습니다!
Recent Comments
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Beautifulsoup (1)

JJUNNAK's

[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기

예제 코드 # URL 열어주는 라이브러리 from urllib.request import urlopen from bs4 import BeautifulSoup # url 지정 url = "https://www.ddaily.co.kr/news/article/?no=241974" # urlopen 함수로 경로를 따라가서 html 변수에 저장 html = urlopen(url) # bs_obj 변수에 url 페이지에 있는 html 저장 bs_obj = BeautifulSoup(html, "html.parser") # 태그로 감싸진 부분 추출 dl = bs_obj.find_all("dl") # 부분에 태그 부분만 추출 dd = dl[1].find_all("dd") # 추출된 dd 객체를 enumerate() 함수..

Crawling 2023. 1. 13. 04:12
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바