更多>>关于我们

西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web(网站)数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构,日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池,可以有效获取互联网任何公开可见信息。

您只需告诉我们您想抓取的网站是什么,您感兴趣的字段有哪些,你需要的数据是哪种格式,我们将为您做所有的工作,最后把数据(或程序)交付给你。

数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。

更多>>官方微博

西安鲲之鹏
陕西 西安

加关注

  • 【经验分享】本文介绍了一例APP使用了非常规ssl pinning导致Fidder抓包失败,最终通过Frida HOOK成功解决,附源码。 >>> http://www.site-digger.com/html/articles/20191018/751.html ​​​​
    发布时间:2019-10-18 13:23:42
  • 【经验分享】今日拨号服务器上某PPPOE拨号持续失败,经查日志:“pppoe: send (sendPacket): Network is down”,ip link 查看对应的虚拟网卡状态是DOWN,无法设置为UP(sudo ip link set dev v051802057684 up失败)。但同一个账号在另外一个机器上测试正常,怀疑可能是MAC地址的问题(例如冲突了),果断删掉虚拟网卡( sudo sudo ip link del v051802057684),然后重建并指定一个不同的MAC,拨号成功!
    发布时间:2019-09-26 10:52:18
  • 【经验分享】昨天下午办公室断了下电,服务器重启后,adb devices显示10台设备都是“?????? no permissions”,第一次遇到这种情况。重启服务器和移动设备问题依据。后来在askubuntu上看到有人提到试一下sudo adb devices,竟然立马识别了(https://askubuntu.com/questions/908306/adb-no-permissions-on-ubuntu-17-04)。很诡异,之前用普通权限都一直正常着,为什么突然就没有权限了?
    发布时间:2019-09-26 08:45:09
  • 【经验分享】Termux自带的am命令版本太低,竟然不支持force-stop(如图1示),经查得知pm clear命令也可以停止一个APP,而且还会将APP的用户数据清除掉(回到刚安装的状态),试了一下果然有效,运行之后"/data/data/包名"目录下只剩下lib目录了。注意:需要root权限。 >>> https://stackoverflow.com/questions/3117095/stopping-an-android-app-from-console ​​​​
    发布时间:2019-09-19 12:20:13
  • 【经验分享】"adb shell 命令",如何让“命令”以root权限执行?
    例如,某设备已root,但当执行adb shell rm /data/data/com.xxxx/cache时提示Permission denied。

    解决方法:
    adb shell "su -c '[your command goes here]'"
    例如:
    adb shell "su -c 'rm /data/data/com.xxxx/cache'"

    参考文章"Is there a way for me to run Adb shell as root without typing in 'su'?" >>> https://android.stackexchange.com/questions/5884/is-there-a-way-for-me-to-run-adb-shell-as-root-without-typing-in-su
    发布时间:2019-09-18 09:16:52
  • 【经验分享】关于小红书搜索结果数据抓取的限制:
    1. 小红书微信小程序版之前是前600条可见,最近已被限制为前60条可见。
    2. 小红书安卓APP版本限制为搜索结果前1000条可见。 ​​​​
    发布时间:2019-09-02 16:42:37
  • 【经验分享】通过ADB启动手机淘宝APP搜索,打开指定关键词的搜索结果列表,如下示例,打开搜索“HUAWEI”的结果:
    adb shell am start -n com.taobao.taobao/com.taobao.search.SearchListActivity -d "taobao://s.taobao.com/search?q=HUAWEI" ​​​​
    发布时间:2019-08-22 16:07:00
  • 【经验分享】手机淘宝APP商品搜索结果采集最新方案20190821(免登录)
    (1)模拟操作APP操作,无需登录,不存在封账号;
    (2)IP限制弱;
    详见下附演示视频。  L西安鲲之鹏的微博视频 ​​​​
    发布时间:2019-08-21 17:52:28
  • 【经验分享】终于搞定了支付宝口碑App数据采集,有图有真相。 ​​​​
    发布时间:2019-08-09 17:52:21
  • 【经验分享】如何采集支付宝小程序的数据?adb模拟操作 + xposed Hook "com.alipay.mobile.nebula.util.H5Utils.parseObject"
    如附图所示,成功获取服务端应答的JSON数据。 ​​​​
    发布时间:2019-08-07 16:13:23
当前位置: 首页 > 公司微博 >
  • 西安鲲之鹏

    发布时间:2016-08-24 12:54:55
    Ubuntu下pppoe-connect(start)提示“execvp: No such file or directory”,经查是pppd不存在,安装后问题解决:sudo apt-get install ppp ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-23 14:14:18
    How to solve "EnvironmentError: mysql_config not foun" problem when set-up MySQL for Python on Ubuntu? >>> http://t.cn/RtBW9q9 ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-23 13:40:56
    大众点评国内目前已涵盖2379个“城市”(一些县甚至地区也被大众点评作为“城市”列出, .e.g http://www.dianping.com/shop/45321696)。为了提高可用性,我们对“城市”字段做了修正,增加“real_city”(真实城市)和“province”(省份)字段 >>> http://t.cn/RtB0cHX ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-20 09:57:39
    Linux how long a process has been running?   ps -p {PID-HERE} -o etime  >>> http://t.cn/RtmxWIB ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-20 09:47:38
    Linux Execute Cron Job After System Reboot:  @reboot  /path/to/job   >>> http://t.cn/RtmxvNz ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-18 10:32:07
    【“美味不用等App”采集分析】HTTP请求加入了签名机制(sign参数),但是存在Bug:sign的值仅与time和nonce两个常量参数(可以一直保持不变)有关,改变核心参数例如page,cityid,shopid请求依然合法。可以正常采集。 ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-15 17:04:56
    查看系统剩余Inode数: df -i
    PS:顺便测试下LICEcap录GIF动画的效果。 ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-08 19:05:23
    在 Debian、Ubuntu 或 Linux Mint 系统中安装 7zip >>> http://t.cn/RtChuyx ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-04 08:48:55
    更改当前用户的Shell。e.g. 修改为zsh:  chsh -s /bin/zsh 根据提示输入密码即可。More details > http://t.cn/Rt6kAZY ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-03 15:07:41
    快递100APP返回一个坐标周边快递员信息(含手机号)接口分析测试截图。 ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-03 11:35:32
    "Selenium + Chrome Diver"使用带用户名密码认证(HTTP Basic Authentication)的代理方法 >>> http://t.cn/RtigU0J ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-08-02 16:56:47
    文档增加Scrapy, Selenium + Chrome/Firefox使用代理示例代码 >>> http://t.cn/RUWE7Dq ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-07-31 11:54:59
    耗了2天时间才发现是webscraping库的一个bug造成的,具体Bug我已经提交到这里了 >>> http://t.cn/RtIo59L 专治疑难杂![嘻嘻] ​​​​

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-07-29 15:18:58
    【折腾几个小时的结果】py2exe打包"selenium + Firefox"应用,运行出现找不到"webdriver.xpi"或"webdriver_prefs.json"问题的原因及解决。
    原因:C:\Python27\Lib\site-packages\selenium\webdriver\firefox\firefox_profile.py中os.path.dirname(__file__)获取到的路径是在exe文件(假设为test.exe)的下级目录,例如 "dist\\test.exe\\selenium\\webdriver\\firefox\\",这当然不存在。
    解决:
    1)复制webdriver.xpi和webdriver_prefs.json到test.exe目录下;
    2)编辑firefox_profile.py文件,修改两处"os.path.join(os.path.dirname(file)," 为 "os.path.join(os.path.dirname(file), '..\..\..\..\'";
    3)重新打包,问题解决。

    阅读全文 +

  • 西安鲲之鹏

    发布时间:2016-07-27 17:29:08
    Selenium + Firefor如何最小化窗口运行? Google不到好的方案,都说不容易直接实现,但是看到一个曲线救国的思路:将窗口位置移动到桌面之外 e.g. driver.set_window_position(-2000, 0)。试了一下效果不错。 ​​​​

    阅读全文 +

QQ在线客服
欢迎咨询,点击这里给我发送消息。
欢迎咨询,点击这里给我发送消息。

加微信咨询