阿里云服务器购买学生的简单介绍
有鱼爱电影 2025-06-21 20:30 2 浏览 0 评论
阅读文本大概需要 2 分钟。
提示
以鄙人在GitHub上阿里云服务器购买学生的辣鸡代码为例, 其他Scrapy阿里云服务器购买学生的项目操作类似, 本文同样适用于不使用云服务器的情形(排除掉前期准备部分即可).
前期准备
(也可以到腾讯云开发者实验室体验)1. 购买云服务器
选择一家云服务厂商, 购买云服务器, 目前国内主流服务均有提供学生版
如果第一次购买, 可以戳这个链接
https://cloud.tencent.com/redirect.php?redirect=1010&cps_key=e042d9552c4c0be2cd377436ca42ee62
2. 下载Xshell, 使用ssh连接服务器
Xshell学生和家用是免费的, 下载地址https://www.netsarang.com/download/free_license.html
下载安装完成后,使用系统分配的公网IP, 系统用户名和对应密码连接服务器.
在Github上克隆代码
git clone https://github.com/FesonX/JobCrawler.git
安装相关依赖1. 安装Python3
项目使用Python3.6, 可以使用以下连接安装, 将文中的3.5改为3.6即可.
ubuntu14.04安装python3.5并且将其设置为python3默认启动
(https://blog.csdn.net/fireflychh/article/details/78195778)
2. 使用virtualenv(也可以使用Anaconda或Pycharm管理)
Virtualenv允许多版本Python同时在电脑上共存, 安装完Python3及pip后 终端键入
# 安装
pip3 install virtualenv
# 创建虚拟环境
virtualenv spider-env
# 激活虚拟环境
source spider-env/bin/activate
# 退出
deactivate
3. 安装库依赖
因为Scrapy依赖Python.h,在安装库依赖前在终端键入
sudo apt-get install libpython3.6-dev
然后安装依赖, 如果失败, 请逐条尝试
# 在JobCrawler/JobCrawler目录下
pip install -r requirements.txt
4. 安装MongoDB
参照以下连接安装 MongoDB Community Edition
(https://docs.mongodb.com/manual/administration/install-community/)
运行爬虫
终端cd到项目根目录, 键入
# -o job.csv为可选参数, 加入则输出到指定文件中
scrapy crawl jobCrawler -o job.csv
扩展: 使爬虫开机运行
使爬虫在系统开机时自动运行, 对于许多系统来说,最简单 (如果不是最好的)的方式是使用rc.local文件 具体实现方式就交由你自己用搜索引擎探索啦
欢迎点击查看原文关注我的腾讯云社区账号
入门小白, 欢迎大家指出错误, 技术交流
QQ:994342122, Email: fesonx@foxmail.com
今日作者: 光光同学_
不爱看电影的摄影师不是好的程序员
- 上一篇:包含域名whois查询工具的词条
- 已经是最后一篇了
相关推荐
-
- 阿里云服务器购买学生的简单介绍
-
阅读文本大概需要2分钟。提示 以鄙人在GitHub上阿里云服务器购买学生的辣鸡代码为例,其他Scrapy阿里云服务器购买学生的项目操作类似,本文同样适用于不使用云服务器的情形(排除掉前期准备部分即可).前期准备(...
-
2025-06-21 20:30 有鱼爱电影
-
- 包含域名whois查询工具的词条
-
1.使用历史 2.是否被K过 3.是否备案过 那么域名whois查询工具我们具体该怎么做呢? 1.首先要到域名查询中心进行域名域名whois查询工具的whois信息查询。 2.查询域名的外链信息:使用DOMAIN指令或者双引...
-
2025-06-21 16:30 有鱼爱电影
-
- 包含网站加速器免费永久电脑版的词条
-
微信电脑版怎么多开网站加速器免费永久电脑版?相信不少使用微信电脑版的朋友还不知道怎么操作吧。今天网站加速器免费永久电脑版,小编就给大家带来微信电脑版多开方法,感兴趣的朋友就跟着小编一起来了解一下吧! 微信电脑版怎么无限多开方法: 微...
-
2025-06-21 10:30 有鱼爱电影
-
- 关于网站模板下载免费商城的信息
-
在网站模板下载免费商城你还在苦苦百度哪里有免费网站模板下载免费商城的自适应网站模板时网站模板下载免费商城,建站宝盒已经悄悄上新网站模板下载免费商城了一大波商城网站模板啦网站模板下载免费商城!从技术层面说,这一系列模板全部采用目前主流的H...
-
2025-06-21 02:30 有鱼爱电影
-
- 阿里云域名个人备案网站备注怎么写的简单介绍
-
在浏览器中搜索“阿里云”阿里云域名个人备案网站备注怎么写,并进入其官方网站找到登录选项,登录你想要备案阿里云域名阿里云域名个人备案网站备注怎么写的账号进入备案系统登录后,在阿里云首页面点击右上角阿里云域名个人备案网站备注怎么写的“备案”选项...
-
2025-06-21 01:30 有鱼爱电影
-
- 服务器购买渠道的简单介绍
-
基础篇 1、什么是淘宝seo? 传统服务器购买渠道的淘宝seo即淘宝搜索引擎优化,通过优化店铺宝贝标题,类目,上下架时间等等来获取较好的排名,从而获取淘宝搜索流量的一种新型技术。广义的淘宝seo是指除去淘宝搜索引擎优化以外,还包括一...
-
2025-06-20 22:30 有鱼爱电影
-
- 关于如何查询域名注册信息的信息
-
很多人都有一颗建站的心如何查询域名注册信息,却因为没有相关的知识如何查询域名注册信息,而无从下手。下面,嗨创H5自助建站工具为大家梳理一下概要,如何查询域名注册信息了解一个网站的诞生之路。 先看一下传统建站的步骤。 网站是怎样建成的...
-
2025-06-20 19:30 有鱼爱电影
-
- 包含wordpressstudio外贸b2b独立站建站教程pdf的词条
-
▲点击图片了解详情▲ 200+家名企内推机会 一对一针对性实习推荐辅导wordpressstudio外贸b2b独立站建站教程pdf, 100%承诺名企实习offer, 不成功,不收费 今日企业 第一创业...
-
2025-06-20 13:30 有鱼爱电影
-
- windows服务器管理器下载的简单介绍
-
日常维护及校验维修中对影响检验结果的因素windows服务器管理器下载,如粉尘、温度、湿度、振动、噪音、腐蚀等因素要密切注意windows服务器管理器下载,严加控制,减小误差。要保证所有仪器工作台面固定、平整,符合使用要求。所有面粉机仪器使...
-
2025-06-20 02:30 有鱼爱电影
-
- 关于seo优化公司如何选择的信息
-
上海链企文化传播有限公司是一家专业从事互联网营销服务seo优化公司如何选择的公司。公司主要业务包括搜索引擎营销、互动营销、新闻营销、社会化媒体营销等一系列网络营销解决方案。公司自创立之初就一直坚持“创新为本,品质为先”的理念,为向互联网...
-
2025-06-20 01:30 有鱼爱电影
你 发表评论:
欢迎- 一周热门
- 最近发表
- 最新留言