728x90 Programming/Python68 [Python] 순열, 조합 itertools 설명 및 예제 안녕하세요. 오늘은 코딩테스트나 실제로 자주 사용되는 Python 내부 모듈 itertools에 대해 알아보겠습니다. 파이썬 itertools 모듈 설명 ▣ itertools란? Python 내장 라이브러리로 자신만의 반복자를 만드는 모듈입니다. 무엇인가 반복되는 요소에 대한 처리나 특정 배열에 대하여 순열이나 조합을 만들어야 할 때 유용하게 사용될 수 있습니다. ▣ 라이브러리 import import itertools ▣ 유용한 itertools 메소드 반복자(generator) 인수 결과 product() p,q.../ repeat = 1 중첩된 loop 반복문에 해당하는 데카르트의 곱 permutations() p [,r] r 길이 tuple, 가능한 모든 순서, 반복 X combinations().. 2021. 8. 24. 파이썬 문제 및 연습 사이트 추천 안녕하세요. 오늘은 직관적이고 간결한 문법으로 많은 프로그래머들과 비전공자들 사이에서 주목을 받는 언어, 파이썬을 공부하는 데 유용한 사이트들을 소개해드리도록 하겠습니다. 코딩테스트 연습 사이트 추천 (파이썬) 근래 it 직무뿐만 아니라 다양한 직무에서 지원자들의 it 역량 측정 도구로 코딩테스트를 활용하고 있습니다. 파이썬뿐만 아니라 컴퓨터공학 전공자들에게 유리한 C++이나 java 등 다양한 언어로 코딩테스트를 대비할 수 있는 사이트를 공유해드리도록 하겠습니다. 1. 프로그래머스 사이트 : 프로그래머스 코딩테스트 연습 코딩테스트 연습 기초부터 차근차근, 직접 코드를 작성해 보세요. programmers.co.kr 난이도는 Level 1부터 5까지 단계별로 수행할 수 있으며, 정말 많은 문제가 있어 코.. 2021. 8. 3. [파이썬] 유튜브 댓글 크롤링 (BTS MV) 사람들이 가장 자주 사용하는 사이트인 유튜브에는 많은 양의 데이터가 매일 쌓이고 있습니다. 오늘은 사람들의 반응을 알아볼 수 있는 동영상 댓글 데이터를 수집(크롤링)해보고 이를 가공, 전처리하는 프로젝트를 진행해보겠습니다. 댓글 크롤링하는 영상 : https://www.youtube.com/watch?v=CuklIb9d3fI BTS 신곡 "Permission to Dance" 최근 가장 핫한 가수인 BTS의 신곡이 나와서 해당 유튜브 영상에 대한 댓글 데이터를 크롤링해보겠습니다. 데이터 구성 : 댓글 내용, 댓글 저자 id, 댓글 날짜, 좋아요 숫자 보시다시피 유튜브는 유저 반응형 웹사이트입니다. 유저의 행동(스크롤 업다운)에 따라 숨어 있던 html 값들이 나오는 구조입니다. 따라서, 셀레니움으로 ht.. 2021. 7. 19. 파이썬 한글 자음 모음 조합하기 (NLP) 안녕하세요. 오늘은 과거 진행했던 NLP 프로젝트에서 유용했던 파이썬 프로그래밍 작업에 대해 리뷰해보겠습니다. 프로젝트 목표 : 한글 검색어에 대한 다양한 모음 조합 찾기 - 샘플 단어 : 텔레비젼 프로그래밍 작업의 목적은 자동으로 어떤 단어에 대한 모음을 재조합하여 다양한 경우의 수 찾기였습니다. 예를 들면, 텔레비젼 -> 텔레비젼, 텔래비젼, 탤레비젼, 탤래비젼 이런 식으로 'ㅔ' 를 'ㅐ'로, 'ㅐ'를 'ㅔ'로 같은 발음을 가졌지만, 모음 하나에서 차이가 나는 경우의 수를 조합하여 데이터를 가공해봤습니다. 똑같은 단어라도 사람마다 말하는 방식(발음)이 다르기에 'ㅔ'와 'ㅐ'를 조합하여 다양한 발음을 고려할 수 있는 검색어 범위를 만들어주고 싶었습니다. 따라서, 다양한 조합을 찾아 회사가 갖고 있는.. 2021. 7. 17. 파이썬 영어 한글 발음으로 변환하기 (콩글리시) 안녕하세요. 오늘은 과거 진행했던 NLP 관련 작업에서 유용하게 사용했던 파이썬 코드에 대해 리뷰해보겠습니다. 프로젝트 : 영어로 된 특정 명사에 대한 다양한 검색어 찾기 - Sample Data : 도시 이름 (한국어 및 영어) kor_city_name eng_city_name 빅토리아 Victoria 프리타운 Freetown 포르보 Porvoo 캐스트리스 Castless 상투메 프린시페 Sao Tome and Principe 포트오브스페인 Port of Spain 오울루 Oulu 아피아 Apia 말레 Male 난탈리 Naantali 로조 Roseau 반다르스리브가완 Bandar Seri Begawan 포르토노보 Porto-Novo 킹스타운 Kingstown 프리토리아 Pretoria ※ 해당 샘플 데.. 2021. 7. 5. 파이썬 유튜브 크롤링 셀레니움 2편 파이썬 Selenium 유튜브(Youtube) 크롤링 2 목표 : 파이썬 자동화 모듈 selenium의 webdriver를 사용하여 유튜브에 원하는 검색어를 던져 나오는 영상 데이터를 대량 및 자동으로 수집하기 for문 + 셀레니움으로 동영상에 대한 썸네일, 제목 등 동적인 Data 자동 수집 ▶ 유튜브 html Check! css_selector로 데이터를 수집하기 * html을 분석하면, 각 영상들이 ytd-video-renderer box 형태로 들어가 있음 확인. 하지만, 우리가 원하는 검색어 종류는 검색어 : 삼성전자에 대한 관련 영상이므로 #contents로 된 box를 잡아야함! ▶ 크롤링 코드 html을 분석하여 css selector 타점을 잡고 또 이에 대한 속성, 텍스트를 원하는 데이.. 2021. 6. 22. 이전 1 ··· 7 8 9 10 11 12 다음 728x90