파이썬
-
[공모주] 38 커뮤니케이션 크롤링파이썬 2020. 12. 28. 18:25
base_url = 'http://m.38.co.kr/ipo/' page_url = 'http://m.38.co.kr/ipo/fund.php?&page={}' each_url = 'http://m.38.co.kr/ipo/fund_view.php?no=1591&page=2' last_page = 10 result = {} for page_num in range(1, last_page + 1): bs = get_soup(page_url.format(page_num), 'cp949') tds = bs.find_all('td') tds = [tds[i] for i in range(len(tds)) if i % 6 == 0] for td in tds: url = base_url + td.find('a')['hre..
-
-
-
Jupyter Lab Keyboard Setting Customization파이썬 2020. 8. 18. 11:07
Hide Cell Output: O Show Cell Output: O, O Hide All Cell Output: Ctrl + [ Show All Cell Output: Ctrl + ] Hide All Cell Code: Ctrl + L Show All Cell Code: Ctrl + ; Restart Kernel and Run All: Ctrl + ' Restart Kernel and Clear All: Ctrl + . 아래의 내용을 Jupyter Lab → Settings → Advanced Settings Editor →Keyboard Shortcuts → User Preferences에 붙여 넣는다. 그러면 위의 8가지 기능에 대하여 단축키를 사용할 수 있다. { // Keyboard Short..
-
사진 파일에서 찍은 날짜 얻기파이썬 2020. 5. 14. 18:16
import exifread import os from glob import glob import re from datetime import datetime path_name = 'photos/' tag = 'Image DateTime' result = {} file_no_tag = [] for file in os.listdir(path_name): f = open(os.path.join(path_name, file), 'rb') tags = exifread.process_file(f) try: result[file] = tags[tag] except: file_no_tag.append(file) regex = re.compile(r'\d{4}:\d{2}:\d{2}') for key, value in r..
-
이젠 주피터 노트북(Jupyter Notebook)에서도 Git을 쓰자파이썬 2020. 4. 1. 23:29
웹에 연결되지 않은 환경에서도 코딩은 필요하다. 에러 없이 돌아가기만 해도 행복하던 시절이 있었다. 하지만 시간은 모든걸 바꾼다. 코드는 점점 복잡해졌고 예상치 못한 상황을 처리하기 위한 예외 처리 코드로 인해 점점 코드의 가독성은 떨어졌다. 코드 테스트와 버전 관리를 더 이상 미룰 수 없다. 당장 배우면서 적용해 보자. 그렇지 않으면 유지보수와 확장은 지옥이 된다. JupyterLab의 extension에서도 git을 설치할 수 있다. 일단 설치하고 바로 사용해 보는 것이 세상에서 제일 중요하다. 내일 출근하면 command를 열고: jupyter labextension install @jupyter-lab/git git의 쉬운 부분만 능숙하게 잘 쓰면 훌륭하다. 잊지 말자, 85% 법칙. 시작부터 완..
-
이제는 Jupyter Notebook을 JupyterLab에서 사용하자파이썬 2020. 3. 29. 22:51
Coursera를 통해 파이썬에 입문한 후 약 1년 후에 pandas를 알게 되었다. pandas를 통해서 기존 파이썬 프로그래밍의 토대 위에 Series와 Dataframe이라는 강력한 자료 구조를 기반으로 excel, txt, csv 등 각종 파일을 너무 쉽게 다룰 수 있게 되었다. 신세계였다. 그동안 Excel에 내장된 Visual Basic for Application (VBA)로 힘들게 코딩했던 결과물들을 돌이켜보니 그야말로 헛고생에 가까웠다. 냉정하게 평가해 보니 동일한 기능을 하는 코드를 짜는데 10배 이상의 시간이 걸린 것 같았다. 어쩌겠는가? 교훈: 새로운 기술을 지속적으로 현업에 적용해 보고 그 중 일부는 second nature로 만들어야 한다. 이후부터는 대부분의 코딩을 Jupyte..