[공모주] 38 커뮤니케이션 크롤링

파이썬 2020. 12. 28. 18:25

base_url = 'http://m.38.co.kr/ipo/'
page_url = 'http://m.38.co.kr/ipo/fund.php?&page={}'
each_url = 'http://m.38.co.kr/ipo/fund_view.php?no=1591&page=2'

last_page = 10
result = {}
for page_num in range(1, last_page + 1):
    bs = get_soup(page_url.format(page_num), 'cp949')
    tds = bs.find_all('td')
    tds = [tds[i] for i in range(len(tds)) if i % 6 == 0]
    for td in tds:
        url = base_url + td.find('a')['href'].replace('./', '')
        result[td.text] = url
    스팩 = re.compile(r'\d+호$')
    삭제들 = []
    for key in result.keys():
        if 스팩.search(key) != None:
            삭제들.append(key)
    for 삭제 in 삭제들:
        del result[삭제]
        
for value in result.values():
    bs = get_soup(value, 'cp949')
    tds = bs.find_all('td')
    tds = [td.text.strip() for td in tds if td.text]
    정리 = {}
    for i, td in enumerate(tds):
        if i % 2 == 0:
            title = td
        else:
            content = td
            정리[title] = content
    for key, val in 정리.items():
        print(f'{key}: {val}')

저작자표시 비영리 변경금지

'파이썬' 카테고리의 다른 글

[파이썬 크롤링] 공모주 정보 수집 (0)	2020.10.26
Ebest XingAPI tr코드 목록 추출 코드 (0)	2020.08.18
Jupyter Lab Keyboard Setting Customization (0)	2020.08.18
사진 파일에서 찍은 날짜 얻기 (0)	2020.05.14
이젠 주피터 노트북(Jupyter Notebook)에서도 Git을 쓰자 (0)	2020.04.01

ABOUT ME

Job Automation with Python Job Automation with Python

'파이썬' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'파이썬' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바