'Dev'에 해당되는 글 12건

  1. 2017.12.26 python web crawling 준비
  2. 2017.12.26 putty를 사용해서 AWS Linux 인스턴스 접속 방법

python web crawling 준비

Dev 2017. 12. 26. 21:28

ubuntu에서 python를 사용한 web crawling을 위해 기본적인 아래 모듈 설치

 

requests - http 사용을 위해 설치

sudo pip install requests

http://docs.python-requests.org/en/master/

 

BeautifulSoup - HTML 해석에 사용

sudo pip install bs4

https://www.crummy.com/software/BeautifulSoup/

 

 

Selenium - 테스트 목적의 웹 자동화 라이브러리, 동적으로 생성되는 웹페이지 크롤링을 쉽게 할 수 있게 해줌

sudo pip install selenium

http://www.seleniumhq.org/download/ 에서 원하는 브라우저와 os에 맞는 버전 선택 후 저장

http://www.seleniumhq.org/

 

pip가 설치되어 있지 않아 위에 설치에 실패하는 경우 아래 실행

sudo apt-get install python-pip

'Dev' 카테고리의 다른 글

aws ubuntu 인스턴스 파일 복사  (0) 2018.01.07
ubuntu timezone 설정  (0) 2018.01.07
ubuntu cron  (0) 2018.01.03
python ide -pycharm  (0) 2017.12.26
putty를 사용해서 AWS Linux 인스턴스 접속 방법  (0) 2017.12.26
Posted by geniusds
,

putty를 사용해서 aws linux 인스턴스에 접속하는 경우 아래 순서로 진행

 

1. puttygen를 이용해서 인스턴스 생성에 사용했던 키를 변환

 

 

 

2. putty를 실행 후 아래 메뉴에 생성한 private key 추가

 

 

3. putty 아래 메뉴에 Host_name 입력 후 Open으로 접속

(현재 상태에서 Saved Sessions에 save 하는 경우 다음 실행 시 Load를 사용해서 해당 설정 그대로 사용 가능)

 

 

user_name의 경우 아래 참고

  • Amazon Linux AMI의 경우 사용자 이름은 ec2-user입니다.

  • RHEL AMI의 경우 사용자 이름은 ec2-user 또는 root입니다.

  • Ubuntu AMI의 경우 사용자 이름은 ubuntu 또는 root입니다.

  • Centos AMI의 경우 사용자 이름은 centos입니다.

  • Fedora AMI의 경우 사용자 이름은 ec2-user입니다.

  • SUSE의 경우 사용자 이름은 ec2-user 또는 root입니다.

 

public_dns_name의 경우 aws 인스턴스 화면에서 확인 가능

 

 

※ 자세한 내용은 아래에서 확인 가능

http://docs.aws.amazon.com/ko_kr/AWSEC2/latest/UserGuide/putty.html

'Dev' 카테고리의 다른 글

aws ubuntu 인스턴스 파일 복사  (0) 2018.01.07
ubuntu timezone 설정  (0) 2018.01.07
ubuntu cron  (0) 2018.01.03
python ide -pycharm  (0) 2017.12.26
python web crawling 준비  (0) 2017.12.26
Posted by geniusds
,