owlfox · December 12, 2019 02:49 · owlfox · Dec 12, 2019
diff --git a/crawler.py b/crawler.py
 # -*- coding: utf-8 -*-
 import scrapy
 import json

 class CrawlerSpider(scrapy.Spider):
    name = 'crawler'
    allowed_domains = ['104']
    start_urls = [
        'https://www.104.com.tw/company/ajax/joblist/5t7gcns?roleJobCat=0_0&area=0&page=1&pageSize=100&order=8&asc=0&',
        'https://www.104.com.tw/company/ajax/joblist/5t7gcns?roleJobCat=0_0&area=0&page=2&pageSize=100&order=8&asc=0&'    
    ]

    def parse(self, response):
        result = json.loads(response.body_as_unicode())
        for item in result['data']['list']['normalJobs']:
            yield item
	# -- coding: utf-8 --
	import scrapy
	import json

	class CrawlerSpider(scrapy.Spider):
	name = 'crawler'
	allowed_domains = ['104']
	start_urls = [
	'https://www.104.com.tw/company/ajax/joblist/5t7gcns?roleJobCat=0_0&area=0&page=1&pageSize=100&order=8&asc=0&',
	'https://www.104.com.tw/company/ajax/joblist/5t7gcns?roleJobCat=0_0&area=0&page=2&pageSize=100&order=8&asc=0&'
	]

	def parse(self, response):
	result = json.loads(response.body_as_unicode())
	for item in result['data']['list']['normalJobs']:
	yield item