[Web Crawling] Selenium 명령어

Lpla

2020. 5. 25. 20:26

참고 : https://selenium-python.readthedocs.io/api.html

출처 : https://deepplin.blog.me/221512366470

1. Selenium으로 DOM요소 선택 - 요소를 찾지 못하면 NoSuchElementException 발생

이름	설명
처음요소를 추출
find_element_by_id(id)	id속성으로 요소를 하나 추출
find_element_by_name(name)	name 속성으로 요소를 하나 추출
find_element_by_css_selector(query)	css 선택자로 요소를 하나 추출
find_element_xpath(query)	xpath를 지정해 요소를 하나 추출
find_element_by_tag_name(name)	태그 이름이 name에 해당하는 요소를 하나 추출
find_element_by_link_text(text)	링크 텍스트로 요소를 추출
find_element_by_partial_link_text(text)	링크의 자식 요소에 포함되 있는 텍스트로 요소를 하나 추출
find_element_by_class_name(name)	클래스 이름이 name에 해당하는 요소를 하나 추출
모든 요소를 추출
find_element_by_css_selector(query)	css 선택자로 요소를 여러개 추출
find_element_by_xpath(query)	xpath를 지정해 요소를 여러개 추출
find_element_by_tag_name(name)	태그이름이 name에 해당하는 요소를 여러개 추출
find_element_by_class_name(name)	클래스 이름이 name에 해당하는 요소를 여러개 추출
find_element_by_partial_link_text(text)	링크의 자식 요소에 포함돼 있는 텍스트로 요소를 여러개 추출

2. Selenium으로 요소르르 조작하기

메서드/ 속성	설명
clear()	글자를 지운다
click()	요소를 클릭
get_attribute(name)	요소 속성중 name에 해당하는 속성 값을 추출
is_displayed()	요소가 화면에 출력되는지 확인
is_enabled()	요소가 활성화돼 있는지 확인
is_selected()	체크박스 등의 요소가 선택된 상태인지 확인
screenshot(filename)	스크린샷
send_keys(value)	키를 입력
submit()	입력 양식을 전송
value_of_css_property(name)	name에 해당하는 css속성 값을 추출
id	id
location	요소의 위치
parent	부모요소
rect	크기와 위치 정보를 가진 사전자료형 리턴
screenshot_as_base64	스크린샷을 base64로 추출
screenshot_as_png	스크린샷을 png형식의 바이너리로 추출
size	요소의 크리
tag_name	태그 이름
text	요소의 내부 글자

3. send_key()에서 특수키 입력

from selenium.Webdriver.common.keys import Keys

ARROW_DOWN / ARROW_LEFT / ARROW_RIGHT / ARROW_UP BACKSPACE / DELETE / HOME / END /INSERT /
ALT / COMMAND / CONTROL / SHIFT ENTER / ESCAPE /SPACE / TAB F1 / F2 / F3 ............./ F12

4. Selenium 드라이버 조작

add_cookie( cookie_dict)	쿠키값을 사전 형식으로 지정
back() / forward()	이전 페이지/ 다음페이지
close()	브라우저 닫기
current_url	현재 url
delete_all_cookies()	모든 쿠키 제거
delete_cookie(name)	name에 해당하는 쿠키 제거
execute( command, params)	브라우저 고유의 명령어 실행
execute_async_script( script, *args)	비동기 처리하는 자바스크립트를 실행
execute_script( script, *args)	동기 처리하는 자바스크립트를 실행
get(url)	웹 페이지를 읽어들임
get_cookie( name)	특정 쿠키 값을 추출
get_cookies()	모든 쿠키값을 사전 형식으로 추출
get_log(type)	로그를 추출(type: browser/driver/client/server)
get_screenshot_as_base64()	base64형식으로 스크린샷을 추출
get_screenshot_as_file(filename)	스크린샷을 파일로 저장
get_screenshot_as_png()	png형식으로 스키란샷의 바이너리를 추출
get_window_position(windowHandle='current')	브라우저의 위치를 추출
get_window_size( windowHandle='current')	브라우저의 크기를 추출
implicitly_wait(sec)	최대 대기 시간을 초 단위로 지정해서 처리가 끈날때 까지 대기
quit()	드라이버를 종료 시켜 브라우저 닫기
save_screenshot(filename)	스크린샷 저장
set_page_load_timeout( time_to_wait)	페이지르르 읽는 타임아웃 시간을 지정
set_script_timeout(time_to_wait)	스크립트의 타임아웃 시간을 지정
set_window_position(x,y,windowHandle='current')	브라우저 위치를 지정
set_window_size(width, height, windowHandle='current')	브라우저 크기를 지정
title	현재 타이틀을 추출

저작자표시 비영리 변경금지

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Lpla 개발 블로그

[Web Crawling] Selenium 명령어

티스토리툴바

Python 카테고리와 연관된 콘텐츠

티스토리툴바