공업통계- 데이터의 척도 **(수기 정리)
통계학 2021. 9. 20. 14:15

데이터의 척도 - 전반적인 흐름 정리 *각 척도 별 통계량과 통계분석* 보충설명: 리커트 척도법 예시 및 장단점

웹 크롤링(Web crawling) 1.-- CGV 무비차트 크롤링
웹크롤링 2021. 8. 23. 18:03

무비차트는 기본적으로 top 7까지 소개하는 식으로 되어있다. 웹 크롤링을 이용하면 이 무비차트를 직접 들여다 보지 않고도 언제든 원하는 순위들을 뽑아낼 수 있다. 1. 두가지 모듈과 함수를 호출 urllib이라는 모듈을 호출하자. 이 모듈에서 request 함수를 req라는 이름으로 꺼내쓰도록 하자. (알리아스) 웹 크롤링 소개에서도 말했던 Beautifulsoup역시 bs4라는 모듈에서 호출해야한다. req.urlopen으로 무비차트의 url을 불러왔으나 이상한 코드가 출력될 것이다. 바로 이때가 beautifulsoup을 쓸 차례다. 이 정제된 코드는 웹 크롤링의 '광산'이다. 이제부터 이 코드를 이해하고, 원하는 대로 뽑아낼 수 있어야한다. 다시 무비차트 페이지로 돌아가자. 이제 서버가 작성해 놓..

웹 크롤링(Web crawling) 0.소개
웹크롤링 2021. 8. 23. 14:10

웹 페이지의 내용을 온전히 가져오거나 일부를 추출해내는 것을 '웹 크롤링(Web crawling)이라고 한다. 거미가 촘촘히 짜여진 거미줄에서 기어다니며 걸려든 먹이를 찾아먹는 모습을 상상해보자. 이와 비슷하게도, 이미 만들어졌거나 상용화된 웹 페이지에서 필요한 정보를 추출하는 행위라는 뜻에서 'Crawl'이라는 단어를 쓰는 듯 하다. 파이썬의 다양한 라이브러리는 이미 자명한지라, 웹 크롤링 역시 'beautifulsoup' 등의 라이브러리를 사용한다고 보면된다. (다른 라이브러리와의 차이점은 생략) 웹 크롤링은 통계관련 종사자가 아니더라도 비전공자가 업무자동화 용도로 쓰면서 많이 대중화 된 추세다. 파이썬의 기본적인 것들을 알면 코드를 이해하는데는 전혀 어렵지 않고, 다만 알고 있어야 할 규칙(?) 정..

<용의자 X의 헌신> by 히가시노 게이고---추리/미스테리 소설 리뷰 **스포 주의**
독서 2021. 8. 18. 09:01

무더위도 어느덧 약해진 8월 중순이 되었다. 아침/저녁으로는 시원한 바람을 느낄 수 있게 되었다. 그리고 오늘 소개할 히가시노 게이고의 바로 이 책이 아마 이런 가을틱한 날씨와 어울리는 책이 아닌가 싶다. 방황하는 칼날을 읽고 난 후 히가시노 게이고의 명작들을 읽어보기로 결심했었다. 그 첫 시도가 이 책이기도 하다. 북커버를 보면 미지수 'X'의 형태가 익숙치 않은가? 수학에서 미지수로 표기하던 문체의 X를 떠올렸다면 정답이다. 이 책을 3가지 키워드로 정리하자면, 아마 '사랑', '배신', '헌신' 이 아닐까. 일방적인 사랑에서 시작된 천재 수학자의 도움이, 다른 사람을 사랑하고 있는 그녀에게 약간의 배신감을 느꼈음에도 불구하고 끝내 그녀를 위해 자신을 헌신하여 희생한 것이다. 이시가미의 범행 트릭은 ..