BeautifulSoup 예제2 음원사이트 Genie 차트 순위 긁어오기
먼저 Genie 사이트에 들어가서 각 차트 별 노래들을 어떻게 뽑아내야 할 지 보겠습니다 tbody 태그안에 tr태그마다 차트 1순위부터 50위 까지 있음을 확인할 수 있었습니다tr태그이면서 class명이 list 인 태그를 검색하여 해당 내용을 긁어오겠습니다 [ Python Code ]123456789101112131415161718192021222324252627282930313233343536373839import urllib.requestfrom bs4 import BeautifulSoup # 1 ~ 50위 url = "https://genie.co.kr/chart/top100"req = urllib.request.Request(url)sourcecode = urllib.request.urlope..
2018.01.24 -
Python을 이용한 이미지 다운로드 ( urlretrieve )
[ 이미지 주소 확인 ] [ Python Code ]123456789101112import randomimport urllib.request def download(URL): name = random.randrange(1,2001) # 1~2000 사이의 랜덤숫자 fullName = str(name) + ".jpg" urllib.request.urlretrieve(URL,fullName) # URL에 해당하는 이미지 다운 후 지정이름으로 image_ddress = "http://imgnews.naver.com/image/5456/2017/12/12/0000002969_001_20171212105051175.jpg" download(image_address) # 함수 실행 Colored by Color S..
2018.01.24 -
BeautifulSoup 예제1 네이버 실시간 검색어 긁어오기
HTML문서를 긁어오려면 HTML문서의 구성을 먼저 파악하고 긁어오고자 하는 태그들을 찾아서 어떻게 해당 태그를 지정할 수 있을 지 결정해야합니다네이버 홈페이지의 소스코드를 살펴보겠습니다 실시간 급상승 검색어에는 클래스가 지정되어 있어서 해당 클래스를 검색함으로써 해당 태그를 선택할 수 있었다 [ 파이썬 코드 ] 1234567891011121314import urllib.requestfrom bs4 import BeautifulSoup url = "https://www.naver.com/"req = urllib.request.Request(url)sourcecode = urllib.request.urlopen(url).read()soup = BeautifulSoup(sourcecode, "html.par..
2018.01.24 -
BeautifulSoup (2) 검색 메서드
[ HTML ]12345678910111213141516171819 The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were Elsie, Lacie and Tillie; and they lived at the bottom of a well. ... Colored by Color Scriptercs [ Python Code ] => 해당 html코드의 문서를 BeautifulSoup의 객체로써 soup변수에 저장한다 [ 검색 메서드 ]tag.next_element / tag.next_elements>>> soup.find(class_="story") # class..
2018.01.18 -
BeatifulSoup (1) 기본 메서드
BeautifulSoup ( https://www.crummy.com/software/BeautifulSoup/bs4/doc/ )BeautifulSoup 다운로드 ( window ) [ HTML문서 ] - 예제에서 사용할 문서12345678910111213141516 The Dormouse's story The Dormouse's story Once upon a time there were three little sisters; and their names were Elsie, Lacie and Tillie; and they lived at the bottom of a well. ...Colored by Color Scriptercs [ Python ] - 기본적인 BeautifulSoup사용 방법123..
2018.01.16 -
Python HTTP Request & Response 실습( urllib module )
[ 실습1 코드 ]1234567891011121314import urllib.request if __name__ = "__main__": url = "https://www.naver.com" req = urllib.request.Request(url) # url요청 이후 req변수에 응답 저장 sourcecode = urllib.request.urlopen(req).read() print(sourcecode) f = open("./response.txt","w") # write mode로 파일 생성 f.write( str(sourcecode) ) # 파일에 응답받은 소스코드 입력 f.close() Colored by Color Scriptercs urllib.request.Request(URL) abst..