본문 바로가기
반응형

개발/python25

Python 검색 엔진 : Whoosh whoosh개요pure-Python search engineOkapi BM25F ranking function 사용Lucene 같이 엿같은 java 환경 안 써도 됨모든 인덱스는 반드시 unicode이어야 함용어 사전AnalysisThe process of breaking the text of a field into individual terms to be indexed. This consists of tokenizing the text into terms, and then optionally filtering the tokenized terms (for example, lowercasing and removing stop words). Whoosh includes several different ana.. 2016. 12. 22.
[python] Python 3 에서 MySQL DB 연동 Python 3 - 특히 Python 3.5 - 환경에서 MySQL을 사용하기란 정말 지읒같다. MySQLdb는 Python 2 위주로 돌아가고, MySQL-python은 아래와 같은 에러가...error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\cl.exe' failed with exit status 2Visual Studio 팩을 아무리 받아도 계속 오류가 뜬다. 이럴 땐, 아래의 파이썬 확장 패키지 사이트에 들어가서 mysqlclient whl을 받는다.http://www.lfd.uci.edu/~gohlke/pythonlibs/#mysqlclient 본인에게 맞는 whl을 받고 cmd 창에서 $ pip ins.. 2016. 12. 22.
Flask로 웹페이지를 만들어보자 BeautifulSoup를 이용해 youtube에서 긁어온 정보를 Flask에 넣어보려고 한다.(BeautifulSoup 크롤링 포스팅) VS에서 Flask 프로젝트는 워낙 기본 샘플이 잘 돼있어서 초보자도 금방 따라할 수 있다. 시작! 1) Flask Web Project를 선택해 새 프로젝트를 하나 만든다. 첫 번째의 'Install into a virtual environment'를 선택해준다. 로컬에서야 그냥 파이썬 패키지를 써도 되지만, 나중에 실제로 웹에 게시할 때엔 가상 환경이 필요하기 때문에 이를 쓴다. 저번에 일을 하다가 Python 2.7한테 엿을 먹은 뒤로는 항상 Python 3.4 버전을 쓴다. 참고로 Python 3.5는 Azure Web 게시가 되지 않고, 아직 Flask에 완전.. 2016. 5. 16.
[Python] BeautifulSoup로 YouTube에서 영상 정보를 크롤링 해보자 * 2019.04.28. 이 글은 2016년에 쓰인 글입니다.현재는 유튜브의 UI 레이아웃이나 태그 등이 모두 바뀌어 이 글을 따라 유튜브를 크롤링할 수 없습니다.혹시 크롤링하는 방법을 찾아 이 글에 들어왔다면 [Python] BeautifulSoup로 웹사이트 크롤링하기 글을 참고하시기 바랍니다. 딱히 유튜브를 크롤링 하는 데에 특별하다고 할 점은 없다. 그냥 유명하고, 유명사이트다 보니 html 태그가 잘 잡혀있어서 크롤링 초보자가 이해하기 좋기 때문이다. 포스팅 전체를 읽기 귀찮다면 그냥 맨 밑의 코드만 봐도 이해는 충분히 될 것이다. 나는 Eminem 공식 페이지에서 영상 링크를 크롤링 할 건데, 에미넴 영상을 크롤링 하는 건 내가 에미넴을 좋아해서이다. 그럼 시작! 1) 일단 VS에서 어떻게, .. 2016. 5. 15.
반응형