谈谈爬虫与反爬虫 发表于 2017-12-08 | 分类于 技术 | 阅读次数: 前言最近同事在群里发了这么一个爬虫地址 (未满18岁慎入),不得不佩服 Scrapy 的强大,但是这让我想到了另外一个问题,PornHub 可以估计随便爬,但是比如像淘宝/亚马逊的商品信息可是一个公司至关重要的数据,显然舍不得让爬虫随便来爬。这就涉及到爬虫与反爬虫的策略问题。 阅读全文 »
PHP Generator 笔记 发表于 2017-12-06 | 分类于 技术 | 阅读次数: 图片来源 https://wpengine.com/try/php7-hosting/ 序先说,标题虽然是《Generator 笔记》,但实际上本文会主要内容会是yield。 以鄙人的拙见,目前大多数 PHPer 对 PHP 的 yield 关键字并不怎么了解,但实际上这却是一块非常值得学习的地方,至少于我而言如此。yield 为 PHP 引入了生成器,协程 等一些复杂概念,导致入门门槛也挺高。 关于学不学yield, 目前,我遇到过以下几类人: 阅读全文 »
又一次新的开始 发表于 2017-12-01 | 分类于 生活 | 阅读次数: 序前天无意看到了这么一篇博文 You should blog even if you have no readers 阅读全文 »
30分钟学正则 发表于 2017-11-29 | 分类于 技术 | 阅读次数: 有一些人,遇到一个问题时就想:“我知道,我会使用正则表达式。” 然后他就有两个问题了。–by Jamie Zawinski 阅读全文 »