저런 사이트를 동일하게 제작하고 싶으신 것 같습니다
보통 저런 마케팅 DB를 쌓는 업체에서 제공하는 DB 수집 크롤러는
자체 제작인 경우가 많습니다
그 이유는 해당 DB를 수집해오는 사이트마다 구조가 다른데다가
마케팅 업체마다 수집하는 데이터의 위치가 노하우 처럼 외부에 공개되지 않은 경우가 많고요
해당 데이터를 실질적으로 수집해오는 사이트에서 API형태로 제공하는 곳도 있지만 그렇지 않은 곳도 많기 때문입니다.
예전에 쇼핑 관련 품목 수집 크롤러를 제작해서 판매한적이 있는데
그당시에 사용한 언어는 파이썬과 PHP를 이용하여
파이썬으로 데이터를 수집하여 MYSQL DB에 저장하고
해당 데이터를 가지고 웹페이지에 표시하여 관리자가 원하는 형태로 표시 및 검색
엑셀로 떨굴 수 있게 제공하였습니다.
아마 저 사이트도 동일하게
파이썬으로 제작된 웹 크롤러가 매시간 또는 매일마다 돌면서 관련 데이터를 DB서버에 저장하고
해당 DB를 사용자들이 검색 옵션을 넣어 원하는 설정대로 출력하게 해주는 구조로 이루어져있을겁니다.
파이썬이 웹크롤링할때 HTML 로 파싱하여 원하는 DIV나 TABLE을 찾아 원하는 데이터만 추려서 DB에 넣는겁니다.
사이트마다 구조가 다르지만 DB에 넣을때는 동일하게 맞춰서 넣을 수 있으니까요.