重难点 | Python基础知识点9 Python的封装继承多态,推荐收藏
- 2019 年 10 月 6 日
- 筆記
今天是基础系列的最后一篇文章,也是一些新手甚至是老手容易忽略的知识点,面向对象。
所有面向对象语言都有三大特征:封装继承多态.那Python中面向对象怎么做?
下面的内容只是我的经验总结,与官方讲解应该是大同小异,有自己的理解会更好些.
封装: 描述某个对象的属性以及方法。 比如狗,狗的大小,颜色,这些东西就是他的属性,狗会叫,这是他的方法。 一般来说描述特征的都是这个对象的属性,描述行为就是方法。
继承:Python语言也支持继承,并且支持多继承,所有对象的都继承
Object
class Spider(object):
上面这个Spider就继承了object类
什么时候可以用到继承呢?如果两个对象有共同的部分,我们就可以把共同的部分抽取出来,作为父类让子类去继承于他.
class Spider(object): # 定义一个抽象类 __metaclass__ = abc.ABCMeta def __init__(self): self.rows_title = [u'招聘标题', u'公司名称', u'公司地址', u'待遇', u'发布日期', u'招聘链接', u'招聘要求描述'] sheet_name = u'51job_Python招聘' return_execl = ExeclUtils.create_execl(sheet_name, self.rows_title) self.execl_f = return_execl[0] self.sheet_table = return_execl[1] self.job_info = [] # 存放每一条数据中的各元素, self.count = 0 # 数据插入从1开始的 def crawler_data(self): ''' 开始爬取数据 :return: ''' for i in range(1, 5): url = 'http://search.51job.com/list/000000,000000,0000,00,9,99,python,2,{}.html?lang=c&stype=1&postchannel=0000&workyear=99&cotype=99°reefrom=99&jobterm=99&companysize=99&lonlat=0%2C0&radius=-1&ord_field=0&confirmdate=9&fromType=&dibiaoid=0&address=&line=&specialarea=00&from=&welfare='.format( i) self.request_job_list(url) # 采集不要太快了,否则容易造成ip被封或者网络请求失败 time.sleep(2) def request_job_list(self, page_url): ''' 获取工作列表 :param page_url: :return: ''' try: headers = { 'Referer': 'http://www.51job.com/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4549.400 QQBrowser/9.7.12900.400' } response = requests.get(page_url, headers=headers) response.encoding = 'gbk' # 如果请求失败,则不能继续进行 if response.status_code != 200: return self.parse_job_list(response.text) except Exception as e: print 'nn出现错误,错误信息是:{}nn'.format(e.message) @abc.abstractmethod def parse_job_list(self, text): ''' 解析工作列表的抽象类,具体实现在子类中 :param text: :return: ''' pass def request_job_detail(self, job_href): ''' 获取工作详情 :param job_href: 招聘工作的链接 :return: ''' try: headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4549.400 QQBrowser/9.7.12900.400' } response = requests.get(job_href, headers=headers) response.encoding = 'gbk' # 如果请求失败,则不能继续进行 if response.status_code != 200: return '' self.parse_job_detail(response.text) except Exception as e: print 'nn出现错误,错误信息是:{}nn'.format(e.message) @abc.abstractmethod def parse_job_detail(self, text): ''' 定义工作详情的抽象类 :param text: :return: ''' pass
比如上面我定义了一个爬虫类,下面我用了子类SpiderBs4来继承父类Spider, 这里面我就可以直接用了父类的一些属性与方法而不用声明。
# coding:utf-8 from bs4 import BeautifulSoup from ExeclUtils import ExeclUtils from Spider import Spider import time class SpiderBs4(Spider): def __init__(self): super(SpiderBs4, self).__init__() def parse_job_list(self, text): try: soup = BeautifulSoup(text, 'html.parser') results = soup.select('div.dw_table > div.el')[1:] for result in results: job_title = result.select('p.t1 span a') job_href = result.select('p.t1 span a') job_company = result.select('span.t2 a') job_address = result.select('span.t3') job_salary = result.select('span.t4') job_date = result.select('span.t5') job_title = job_title[0].attrs['title'] if len(job_title) > 0 else '' job_href = job_href[0].attrs['href'] if len(job_href) > 0 else '' job_company = job_company[0].attrs['title'] if len(job_company) > 0 else '' job_address = job_address[0].text if len(job_address) > 0 else '' job_salary = job_salary[0].text if len(job_salary) > 0 else '' job_date = job_date[0].text if len(job_date) > 0 else '' self.job_info.append(job_title) self.job_info.append(job_company) self.job_info.append(job_address) self.job_info.append(job_salary) self.job_info.append(job_date) self.job_info.append(job_href) self.request_job_detail(job_href) time.sleep(1) except Exception as e: print 'nn出现错误,错误信息是:{}nn'.format(e.message) def parse_job_detail(self, text): try: soup = BeautifulSoup(text, 'html.parser') try: # 工作描述 job_statements = soup.select('div.job_msg') job_statement = job_statements[0].text.strip(' ').replace(' ', '').replace('n', '') except Exception as e: print e.message job_statement = '职位无明确描述' self.job_info.append(job_statement) self.count = self.count + 1 ExeclUtils.write_execl(self.execl_f, self.sheet_table, self.count, self.job_info, u'bs4_51job招聘.xlsx') print '采集了{}条数据'.format(self.count) # 清空集合,为再次存放数据做准备 self.job_info = [] except Exception as e: print 'nn出现错误,错误信息是:{}nn'.format(e.message) # # # if __name__ == '__main__': # x = SpiderBs42() # x.crawler_data()
多态:某个对象会有相同的行为,但具体这些行为又有所不同。 比如说吃饭,大人吃饭使用筷子,小孩吃饭用勺子,吃放的行为有所不同. 这个时候我们把吃饭的行为抽象出来,放在父类里。
@abc.abstractmethod def parse_job_list(self, text): ''' 解析工作列表的抽象类,具体实现在子类中 :param text: :return: ''' pass @abc.abstractmethod def parse_job_detail(self, text): ''' 定义工作详情的抽象类 :param text: :return: ''' pass
比如上面我在父类里写了两个抽象方法,我并没有直接去实现它,而是在他们的子类中去实现,因为他们各自实现是不同的。
好了今天的封装继承多态就讲这些,而这些东西一定要灵活运用,死记硬背是不行的,一定要多想想。你又是如何使用封装继承多态的呢?
【完】