Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- java
- 자바 삼항연산자
- 자바 반복문
- 이클립스 DB연동
- Vue3
- 자바 switch문
- MySQL
- 자바 공배수
- 자바 if문
- TypeScript
- 자바 향상된 for문
- 조코딩
- 자바 강제 캐스팅
- 정보처리기사실기
- react with typescript
- 자바 스캐너
- 자바 자동캐스팅
- 자바 while문
- 변수
- 자바 조건문
- 항해99
- 자바 구구단 출력
- 자바 for문
- 항해99 2기
- 자바 public
- 타입스크립트
- Til
- react ag grid
- 프로그래머스
- 자바
Archives
- Today
- Total
뇌 채우기 공간
[python] 메타태그 크롤링 하는 법 본문
import requests
from bs4 import BeautifulSoup
url = 'https://movie.naver.com/movie/bi/mi/basic.nhn?code=171539'
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(url,headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
# 여기에 코딩을 해서 meta tag를 먼저 가져와보겠습니다.
# 이 방법대로 하면 안나옴
# title = soup.select_one('head > meta:nth-child(9)')
title = soup.select_one('meta[property="og:title"]')['content']
image = soup.select_one('meta[property="og:image"]')['content']
desc = soup.select_one('meta[property="og:description"]')['content']
print(title, image, desc)
728x90
'WEB > python' 카테고리의 다른 글
[python] 파이썬 if문 삼항연산자 (0) | 2021.06.11 |
---|---|
[python] 파이썬 파일 분리해서 가져와서 쓰는 법 (0) | 2021.06.11 |
[python] flask서버에 POST API, GET API만들기/ 리뷰를 작성하면 바로 밑에 뜨게 만들기 (0) | 2021.06.10 |
[python] GET요청과 POST요청 코드 기본/ ajax코드 (0) | 2021.06.10 |
[python] 지니뮤직 크롤링하고 이름 순위 아티스트 가져오기/ 파이썬 공백 제거 strip(), [n:n] (0) | 2021.06.10 |