页面解析

在前端开发中,我们常常会使用 jquery 进行元素获取,而在爬虫的世界里,对页面的解析也必不可少,我们通常会使用 cheerio 进行页面解析

安装

yarn add cheerio

使用方式跟 jquery 一毛一样:

const cheerio = require('cheerio')
const $ = cheerio.load('<h2 class="title">Hello world</h2>')
$('h2.title').text('Hello there!')
console.log($.html()); // <html><head></head><body><h2 class="title">Hello there!</h2></body></html>
$('h2').addClass('welcome')
console.log($.html()); // <html><head></head><body><h2 class="title welcome">Hello there!</h2></body></html>
console.log($('.title').text()); // Hello there!
$('.title').attr('id', 'headTitle')
console.log($('h2').attr('id')); // headTitle

算了,不多说了,只要会 jquery 的都应该会吧,不会的去补基础吧

MIT Licensed | Copyright © 2018-present 滇ICP备16006294号

Design by Quanzaiyu | Power by VuePress