웹크롤링 도무지 못하겠네요 도와주세요

웹크롤링 도무지 못하겠네요 도와주세요

작성일 2023.03.19댓글 1건
    게시물 수정 , 삭제는 로그인 필요



https://program.kbs.co.kr/1fm/radio/kfmmusic/pc/board.html?smenu=94c6a7&bbs_loc=R2018-0058-03-644781,list,none,1,0

파이썬으로 여기서 곡 리스트를 카피하려고 하는데 

다른 사이트는 크롤링이  되는데 이 사이트는 안 되네요 

selenium은 잘 안되는 것 같아서 selenium말고 다른 방법으로 부탁드립니다. 



profile_image 익명 작성일 -

이 웹 사이트는 자바스크립트를 사용하여 동적으로 콘텐츠를 생성하기 때문에, 일반적인 크롤링 방법으로는 데이터를 가져오기 어렵습니다. 그러나 개발자 도구를 사용하여 페이지의 네트워크 요청을 살펴보면, 데이터가 로드되는 API 엔드포인트를 찾을 수 있습니다.

이 경우, 데이터는 다음 URL에서 가져올 수 있습니다:

https://program.kbs.co.kr/1fm/radio/kfmmusic/pc/getProgramBoardList.html?bbs_loc=R2018-0058-03-644781&pageNo=1&searchKeyword=&searchDate=&smenu=94c6a7

이 엔드포인트에서 데이터를 크롤링하기 위해 requests와 BeautifulSoup를 사용할 수 있습니다.

import requests from bs4 import BeautifulSoup url = "https://program.kbs.co.kr/1fm/radio/kfmmusic/pc/getProgramBoardList.html?bbs_loc=R2018-0058-03-644781&pageNo=1&searchKeyword=&searchDate=&smenu=94c6a7" response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') song_list = soup.find_all('div', class_='songlist') for idx, song in enumerate(song_list): song_info = song.find_all('div', class_='info') song_artist = song_info[0].text.strip() song_title = song_info[1].text.strip() print(f"{idx + 1}. {song_artist} - {song_title}")

위 코드는 첫 페이지의 곡 목록만 가져옵니다. 모든 페이지의 곡 목록을 가져오려면 페이지 번호를 증가시키면서 요청을 보내야 합니다. 이를 위해 반복문을 사용할 수 있습니다.

영어 자기소개좀 도와주세요

... 하려하니 도무지 못하겠네요 ㅠ 부탁드립니다, 1)영어 자기소개 안녕하세요 제소개를 할께요 나이는 25이구 올해 대학을 졸업했구 전공은...

컴퓨터 조립 "초"고수님들의 명쾌한...

... 6C 800 둘중에 하나로 바꾸고 싶은데 도무지 결정을 못하겠네요. RAM : 삼성 256 DDR... 제발 도와주세요.. ㅠ.ㅜ 아침까지 서핑해봤자 혼자서는 도무지 답을...

네이버 뉴스 검색 웹 크롤링 도와주세요!

VBA 조차 처음이라 며칠 독학하고 하려 했지만 도무지 나오지 않아 염치 불구하고... (뉴스 크롤링) ex) 엑셀시트에 [전일 날짜], [검색어], [기사 제목], 매체사 (ex 중앙일보...

직장을 관두고 공부를 하려고...

... 괜찮을지 도무지 정하질 못하겠습니다.. 다음주면... 아직도 정하질 못하겠네요.. 웹디자인/마스터/프로그래머... 싶습니다..도와주세요 열분들^^ 내공겁니다 웹디자너가...