본문 바로가기
반응형

전체 글320

[Python] BeautifulSoup로 YouTube에서 영상 정보를 크롤링 해보자 * 2019.04.28. 이 글은 2016년에 쓰인 글입니다.현재는 유튜브의 UI 레이아웃이나 태그 등이 모두 바뀌어 이 글을 따라 유튜브를 크롤링할 수 없습니다.혹시 크롤링하는 방법을 찾아 이 글에 들어왔다면 [Python] BeautifulSoup로 웹사이트 크롤링하기 글을 참고하시기 바랍니다. 딱히 유튜브를 크롤링 하는 데에 특별하다고 할 점은 없다. 그냥 유명하고, 유명사이트다 보니 html 태그가 잘 잡혀있어서 크롤링 초보자가 이해하기 좋기 때문이다. 포스팅 전체를 읽기 귀찮다면 그냥 맨 밑의 코드만 봐도 이해는 충분히 될 것이다. 나는 Eminem 공식 페이지에서 영상 링크를 크롤링 할 건데, 에미넴 영상을 크롤링 하는 건 내가 에미넴을 좋아해서이다. 그럼 시작! 1) 일단 VS에서 어떻게, .. 2016. 5. 15.
[Project Euler 40] 어떤 무리수에서 소수점 n번째 자리 숫자 알아내기 소수점 뒤에 양의 정수를 차례대로 붙여 나가면 아래와 같은 무리수를 만들 수 있습니다. 0.123456789101112131415161718192021... 이 무리수의 소수점 아래 12번째 자리에는 1이 옵니다 (위에서 붉게 표시된 숫자). 소수점 아래 n번째 숫자를 dn이라고 했을 때, 아래 식의 값은 얼마입니까? d1 × d10 × d100 × d1000 × d10000 × d100000 × d1000000 꽤나 간단한 문제였는데 푸는 데는 좀 걸렸다. 식 자체는 바로 냈는데 그 식이 3분 넘게 걸린다는 게 문제였지... 처음엔 양의 정수를 뒤에 붙일 때마다 리스트에 추가하고, ''.join() 으로 나열했는데 이게 시간을 어마무지하게 잡아먹었다. 내가 삽질했다는 걸 깨닫고 나서 그냥 str로 계속.. 2016. 5. 6.
2016년 1회 정보처리기사 최종합격! 헤헤.딱 60점으로 합격!이번 시험이 너무 쉬웠던지라 뭔가 민망한 점수긴 하지만.... 1)다 맞아야 한다고 정설이 나있던 알고리즘과 데이터베이스를 각각 3개씩 틀렸다.데이터베이스는 그렇다쳐도 알고리즘은 자신 있었는데, 시험 때 갑자기 멘붕상태가 돼서 삽질로 한 시간을 보내다가 그냥 대충 적어냄...그래도 업무프로세스를 다 맞았고, 신기술동향이나 영어도 거의 다 맞아서 퉁칠 수 있었다. 2)일본여행 갔다온 직후부터 공부하느라 공부기간이 딱 6일이었다.회사에서 배려를 해줘서 퇴근 2시간 전부터 공부할 수 있게 해주셨당.(하루에 4시간 정도 공부했다.)전공자나, 혹 비전공자라도 감이 어느 정도 잡혀있다면 2-3일만 빡세게 해도 될 듯하다. 3)데이터베이스, 업무프로세스는 아래 블로그를 보고 공부했다.http.. 2016. 5. 6.
[Project Euler 39] 가장 많은 직각삼각형이 만들어지는 둘레(≤ 1000)의 길이는? 세 변의 길이가 모두 자연수 {a, b, c}인 직각삼각형의 둘레를 p 로 둘 때, p = 120 을 만족하는 직각삼각형은 아래와 같이 세 개가 있습니다. {20, 48, 52}, {24, 45, 51}, {30, 40, 50} 1000 이하의 둘레 p에 대해서, 직각삼각형이 가장 많이 만들어지는 p의 값은 얼마입니까? 피타고라스 정의를 이용하는 문제.일단 수도코드 #1차) 101.58초(왓더...)#2차) 24.49초. a, b for loop를 전부 도는 대신 p/2로 변경#3차) 23.42초. math.ceil() 대신 round를 씀. 다른 것도 math.sqrt()를 써봤는데 안 쓰는 게 더 빠른 듯하다.#4차) 12.57초. 여기서부터는 로직이 아니라 수학(이걸 수학이라 부를 수 있다면.)이 .. 2016. 5. 5.
반응형