[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기

Today

Total

Notice

블로그 이사 왔습니다!

Recent Comments

관리 메뉴

JJUNNAK's

[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기 본문

Crawling

[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기

최낙준 2023. 1. 13. 04:12

예제 코드

# URL 열어주는 라이브러리
from urllib.request import urlopen
from bs4 import BeautifulSoup

# url 지정
url = "https://www.ddaily.co.kr/news/article/?no=241974"
#  urlopen 함수로 경로를 따라가서 html 변수에 저장
html = urlopen(url)
# bs_obj 변수에 url 페이지에 있는 html 저장
bs_obj = BeautifulSoup(html, "html.parser")

# <dl> 태그로 감싸진 부분 추출
dl = bs_obj.find_all("dl")

# <dl>부분에 <dd>태그 부분만 추출
dd = dl[1].find_all("dd")

# 추출된 dd 객체를 enumerate() 함수로 나누어서 인덱스 + 텍스트 형식으로 print
for idx, element in enumerate(dd):
    print(idx, element.text)

결과

저작자표시 (새창열림)

'Crawling' 카테고리의 다른 글

[ BeautifulSoup4 ] find(), find_all() 차이점. (0)	2023.01.13
공공데이터 OpenAPI 사용법 (예제) (0)	2023.01.13
[ Selenium ] 로또 당첨번호 크롤링 예제 (0)	2023.01.13
[ Selenium ] 해외 축구사이트 크롤링 예제 (0)	2023.01.13
[ Selenium ] Selenium 준비과정 (0)	2023.01.13

'Crawling' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

JJUNNAK's

JJUNNAK's

[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기 본문

[ BeautifulSoup4 ] 뉴스 웹페이지 크롤링 하기

'Crawling' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역