公司微博_鲲鹏Web数据抓取 - 专业Web数据采集服务提供商

更多>>关于我们

西安鲲之鹏网络信息技术有限公司从2010年开始专注于Web（网站）数据抓取领域。致力于为广大中国客户提供准确、快捷的数据采集相关服务。我们采用分布式系统架构，日采集网页数千万。我们拥有海量稳定高匿HTTP代理IP地址池，可以有效获取互联网任何公开可见信息。

您只需告诉我们您想抓取的网站是什么，您感兴趣的字段有哪些，你需要的数据是哪种格式，我们将为您做所有的工作，最后把数据（或程序）交付给你。

数据的格式可以是CSV、JSON、XML、ACCESS、SQLITE、MSSQL、MYSQL等等。

快捷导航

更多>>技术文章

更多>>官方微博

西安鲲之鹏: 陕西西安

【经验分享】未解锁BL的手机进9008模式（Mi6X为例）

对于未解锁BL的手机，需要拆机，通过短接特定触点的方式进入9008模式。
以小米Mi6X为例：
第一步，拧掉充电口旁边的两颗螺丝。
第二步，扣开后盖，可能不太好扣，可以借助美工刀在边缘撬一下。拧掉保护条上的3个螺丝。
第三步，拔掉电池排线。看图，记着两个短接触点的位置。
第四步，用镊子短接两个触点，同时插入TypeC线，2秒左右设备管理器"端口COM"里会出现9008接口，此时松开镊子。
发布时间：2024-11-27 10:13:20
【经验分享】已解锁BL的手机进9008模式

高通9008模式全称"Qualcomm HS-USB QDLoader 9008"，它相对于recovery、fastboot和Android系统是独立的。即深刷模式，也叫EDL，号称"救砖神奇"。

对于已解锁BL的手机，进入9008相对比较简单，以小米Mi6X为例：
1. 先确定手机是否解锁BL了。已解锁BL的手机，刚开机的时候会有"Unlocked"字样，如附图1所示。
2. 长按“音量减键 + 开机键”进入fastboot。
3. 执行fastboot oem edl，即可进入9008模式，进入成功后设备管理器COM端口里可以看到"Qualcomm HS-USB QDLoader 9008"。如附图2、3所示。
发布时间：2024-11-26 12:53:03
【经验分享】com.android.org.conscrypt.TrustManagerImpl证书固定检测绕过示例

某APP使用通用的sslunpinning脚本后仍然抓不到包：
（1）分析logcat日志，发现com.android.org.conscrypt.TrustManagerImpl类相关代码抛出java.security.cert.CertificateException异常，如图1所示。
（2）hook 类com.android.org.conscrypt.TrustManagerImpl的checkTrusted和checkServerTrusted方法，返回空列表，成功抓到包。

日志线索寻找关键词：CertificateException、CertificateExpiredExceptio、SSLHandshakeException
发布时间：2024-10-24 15:36:45
【经验分享】如何获取安卓手机上已安装APP的安装包(.apk)文件？

1. 先查看已安装APP列表，确定对应APP的包名。
adb shell pm list packages
2. 假设包名为org.gushiwen.gushiwen。再根据包名查看APP的详细信息：
adb shell dumpsys package org.gushiwen.gushiwen
返回信息中的path属性，以base.apk结尾的，即就是这个APP的安装文件，如附图1所示。另外返回的信息中还有当前APP的版本（versionName属性），如附图2所示。
3. pull下来这个文件，就可以在其它设备上安装了。
发布时间：2024-10-22 11:27:51
【经验分享】Dell R720意外断电重启之后丢失硬盘（硬盘状态变为Foreign）问题解决？

本来有10块盘，启动的时候显示只有9块Virtual Disk。“Ctrl + R”进入RAID设置，在“VD Mgmt”标签页下也只看到了9块Virtual Disk。在“PD Mgmt”标签页下看到是有10块物理盘，不过第5块状态变成“Foreign”了（如附图1所示）。

解决方法：在“VD Mgmt”标签页下，焦点切换到"PERC H710 Mini"上按F2，然后"Foreign Config"，再然后"Import"，操作完成（要等待几秒）之后就能看到全部盘了，如图2所示。

PS：用Ctrl + N快捷键切换菜单标签。
发布时间：2024-10-18 16:35:44
【经验分享】一个游戏闯关模式学习CSS Selector的网站"CSS Diner"：https://flukeout.github.io/。
Python使用BeautifulSoup实现CSS Selector解析HTML文档的示例：

import requests
from bs4 import BeautifulSoup

r = requests.get('http://www.site-digger.com/html/articles/')
r.encoding = 'UTF-8'
html = r.text
soup = BeautifulSoup(html)
for a in soup.select('ul[class="arclist"] li a'):
print(a['href'], a.text)
发布时间：2024-09-02 19:43:03
【经验分享】qemu-system-x86运行tiny11
(1) 安装qemu-system-x86，安装完成后无需重启。
sudo apt-get update
sudo apt-get install qemu qemu-utils qemu-system-x86
(2) 创建硬盘。
qemu-img create -f qcow2 tiny11.img 50G
(3) 创建虚拟机。
sudo qemu-system-x86_64 --enable-kvm -m 2G -smp 4 -boot order=dc -hda /home/qi/kvm/tiny11-1/tiny11.img -cdrom /home/qi/kvm/tiny11_23H2_x64.iso -vnc :1
(4) vnc连接 "服务器ip:5901"，完成系统安装过程。设置vnc密码的方法：https://qemu-project.gitlab.io/qemu/system/vnc-security.html#with-passwords。
(5) 映射主机端口给虚拟机，使用-redir参数。如下示例，将主机的TCP/UDP4001端口映射到虚拟机的4000端口。
-redir tcp:4001::4000 -redir udp:4001::4000
发布时间：2024-08-10 12:13:46
【经验分享】Playwright过geo.captcha-delivery.com检测

page.add_init_script('''Object.defineProperties(navigator, {webdriver:{get:()=>undefined}}); delete navigator.__proto__.webdriver;''')

发布时间：2024-07-31 10:41:18
【经验分享】scrcpy在网络质量欠佳环境下可以通过降低码率来提高流畅度
e.g.
scrcpy --bit-rate 1M --max-fps 5
注意：在新版本中--bit-rate参数更名为--video-bit-rate

发布时间：2024-07-03 10:11:54
【经验分享】scrcpy在小米手机上鼠标不起作用问题的解决

在“开发者选项”中需要打开"USB调试（安全设置） - 允许通过USB调试修改权限或模拟点击"。要打开这个选项，手机需要先登录小米账号，另外手机必须要插有SIM卡。
发布时间：2024-07-03 10:09:29

当前位置: 首页 > 公司微博 >

西安鲲之鹏

发布时间：2019-11-06 09:32:19

【视频演示】ANJUKE新房楼盘/二手房小区详细参数，基于APP采集，IP限制弱。

二手房小区字段：
u'community_id', u'城市', u'小区名', u'本月均价', u'价格变动', u'所在版块', u'地址', u'总户数', u'建造年代', u'物业公司', u'物业类型', u'物业费', u'开发商', u'总建面积', u'容积率', u'停车位', u'绿化率', u'经度', u'纬度', u'简介'

新房楼盘字段：
u'loupan_id', u'城市', u'楼盘名称', u'别名', u'楼盘价格', u'特色', u'区域位置', u'楼盘地址', u'建筑类型', u'规划户数', u'工程进度', u'开盘时间', u'交房时间', u'容积率', u'绿化率', u'开发商', u'物业类型', u'物业公司', u'物业管理费', u'车位比', u'车位数', u'楼层状况', u'楼盘户型', u'经度', u'纬度' 西安鲲之鹏的微博视频

阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-10-30 12:05:49
【经验分享】grep命令提示Binary file (standard input) matches（如附图所示）怎么解决？
可以使用-a参数，e.g. grep -a 'pattern'。
-a, --text
Process a binary file as if it were text; this is equivalent to the ‘--binary-files=text’ option.

>>> http://t.cn/Ai1RqEdR
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-10-21 10:44:18
【经验分享】链家APP ssl pinning的分析和解决
（1）直接Fiddler抓包，失败，APP报网络异常，如图1所示；logcat报javax.net.ssl.SSLPeerUnverifiedException异常，如图2所示。
（2）反编译apk，查到证书验证部分核心代码，如图3和4所示。
（4）通过Frida HOOK okhttp3.internal.tls.OkHostnameVerifier verify()方法，始终返回true，绕过证书固定验证，代码如下：
Java.perform(function () {
    var OkHostnameVerifier = Java.use('okhttp3.internal.tls.OkHostnameVerifier');
    try {
         OkHostnameVerifier.verify.overload('java.lang.String', 'javax.net.ssl.SSLSession').implementation = function(p0, p1){
             console.log('ssl unpinning for "' + p0 + '"');
             return true;
       };
     } catch (e) {
        console.log(e);
    }
});
（5）如图5所示，Fiddler成功抓取到链接APP的HTTP交互数据。
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-10-18 13:23:42
【经验分享】本文介绍了一例APP使用了非常规ssl pinning导致Fidder抓包失败，最终通过Frida HOOK成功解决，附源码。 >>> http://t.cn/Ai3tEzbP
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-09-26 10:52:18
【经验分享】今日拨号服务器上某PPPOE拨号持续失败，经查日志：“pppoe: send (sendPacket): Network is down”，ip link 查看对应的虚拟网卡状态是DOWN，无法设置为UP（sudo ip link set dev v051802057684 up失败）。但同一个账号在另外一个机器上测试正常，怀疑可能是MAC地址的问题（例如冲突了），果断删掉虚拟网卡（ sudo sudo ip link del v051802057684），然后重建并指定一个不同的MAC，拨号成功！
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-09-26 08:45:09

【经验分享】昨天下午办公室断了下电，服务器重启后，adb devices显示10台设备都是“?????? no permissions”，第一次遇到这种情况。重启服务器和移动设备问题依据。后来在askubuntu上看到有人提到试一下sudo adb devices，竟然立马识别了（http://t.cn/AinpW0dY）。很诡异，之前用普通权限都一直正常着，为什么突然就没有权限了？
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-09-19 12:20:13
【经验分享】Termux自带的am命令版本太低，竟然不支持force-stop（如图1示），经查得知pm clear命令也可以停止一个APP，而且还会将APP的用户数据清除掉（回到刚安装的状态），试了一下果然有效，运行之后"/data/data/包名"目录下只剩下lib目录了。注意：需要root权限。 >>> http://t.cn/AiEFayJc
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-09-18 09:16:52

【经验分享】"adb shell 命令"，如何让“命令”以root权限执行？
例如，某设备已root，但当执行adb shell rm /data/data/com.xxxx/cache时提示Permission denied。

解决方法：
adb shell "su -c '[your command goes here]'"
例如：
adb shell "su -c 'rm /data/data/com.xxxx/cache'"

参考文章"Is there a way for me to run Adb shell as root without typing in 'su'?" >>> http://t.cn/AiEd4P8m
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-09-02 16:42:37
【经验分享】关于小红书搜索结果数据抓取的限制：
1. 小红书微信小程序版之前是前600条可见，最近已被限制为前60条可见。
2. 小红书安卓APP版本限制为搜索结果前1000条可见。
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-08-22 16:07:00
【经验分享】通过ADB启动手机淘宝APP搜索，打开指定关键词的搜索结果列表，如下示例，打开搜索“HUAWEI”的结果：
adb shell am start -n com.taobao.taobao/com.taobao.search.SearchListActivity -d "taobao://s.taobao.com/search?q=HUAWEI"
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-08-21 17:52:28

【经验分享】手机淘宝APP商品搜索结果采集最新方案20190821(免登录)
（1）模拟操作APP操作，无需登录，不存在封账号；
（2）IP限制弱；
详见下附演示视频。西安鲲之鹏的微博视频

阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-08-09 17:52:21
【经验分享】终于搞定了支付宝口碑App数据采集，有图有真相。
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-08-07 16:13:23
【经验分享】如何采集支付宝小程序的数据？adb模拟操作 + xposed Hook "com.alipay.mobile.nebula.util.H5Utils.parseObject"
如附图所示，成功获取服务端应答的JSON数据。
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-07-10 17:08:14
【经验分享】Linux server(headless模式)下Android模拟器的实现。

现在越来越多的采集项目（采集APP数据）需要用到安卓模拟器了，然而市面上还没有支持Linux server(headless模式)下运行的安装模拟器，太遗憾了（因为公司大多数服务器都是Ubuntu server版本）。

我们可以使用KVM + Android x86版系统来实现：

1. 安装配置KVM。关于KVM在Ubuntu server下的安装配置步骤，详见我们去年的这篇文章：http://t.cn/EGdGjVE。
2. Android x86是支持运行于 x86 PC上的Android操作系统。下载Android X86 系统安装ISO文件，下载地址：http://t.cn/AiOgft2w，我测试的是android-x86-6.0-r3.iso。
3. 创建KVM虚拟硬盘：
qemu-img create -f qcow2 ./android60-1/android.img 10G
PS：磁盘大小10GB，虚拟磁盘文件存储路径./android60-1/android.img（后面要用到）。
4. 创建好网桥br0（直连主机外网，如附图1所示）。让虚拟机通过桥接模式上网，这样我们就可以很方便的从外网使用adb连接5555端口，进行远程控制。网桥的配置方法详见http://t.cn/EGdGjVE。
5. 启动KVM虚拟机，安装Android x86系统：
qemu-system-x86_64 -enable-kvm -m 2048 -smp 4 -cdrom "android-x86-6.0-r3.iso" -hda "./android60-1/android.img" -net nic,model=virtio,macaddr=00:16:3E:51:CC:10 -net bridge,br=br0 -vnc :2

PS： 2048M内存，4核CPU，光驱链接系统安装镜像文件android-x86-6.0-r3.iso，指定虚拟机使用00:16:3E:51:CC:10这个MAC，使用网桥br0，指定VNC端口为5900 + 2 = 5902。

执行上述命令之后，就可以通过VNC连接5902端口，进行系统安装了，安装过程很简单，跟其它Linux发行版安装过程类似：先是分区，格式化磁盘，然后写入文件，重启（如附图2所示）。
6. 系统好之后，再次运行上述命令（注意要把-cdrom相关参数去掉，否则默认还会从光盘启动），首次进入系统，需要完成系统初始化配置。

PS：需要注意的是，如果卡到WIFI配置那里了（提示无法连接网络，安装向导无法连接到谷歌，原因你懂的），可以先关掉网络，方法是按Alt + F1，进入安装命令行模式（可以ping www.baidu.com，发现网络其实是通着的），执行ifconfig eth0 down断掉网络（如附图3所示），然后再按Alt + F7恢复图形模式，继续完成向导即可。

7. 配置好一个安卓虚拟机之后，我们可以直接通过复制多个虚拟磁盘文件android.img，启动多个安卓系统。注意：要指定不同的MAC地址，和不同的VNC端口。

如附图4和5所示，我配置好一个虚拟机，安装上所需的各种APP之后，通过直接复制android.img，又启动了2个MAC地址不同的安卓模拟器。

如附图6所示，通过adb远程连接上各安卓虚拟机（模拟器）。
阅读全文 + 去微博评论 +
西安鲲之鹏

发布时间：2019-06-28 16:27:07
【经验分享】美团外卖APP在siua头里隐藏了什么信息？
1. 美团外卖发出的HTTP请求头里有个叫做siua的头（如图1所示），它是什么鬼？
2.反编译APK，一路跟踪，找到了startCollection()，如图2所示。就是它了。
3. 通过Xposed HOOK上述函数，成功获取到明文数据（如下所示）。也如图3所示。

1.0}}MSM8974|Xiaomi|cancro_wc_lte|cancro|KTU84P|zh|CN|Xiaomi|MI 4LTE|4.4.4|19|release-keys|Xiaomi/cancro_wc_lte/cancro:4.4.4/KTU84P/99.12.4:user/release-keys|qcom|qh-miui-ota-bd58|user|cancro|armeabi-v7a|armeabi|cancro-user 4.4.4 KTU84P 99.12.4 release-keys|1|0|}}mtp,adb|mtp,adb|mtp,adb|MPSS.DI.3.0-525eb9a|Qualcomm RIL 1.0|wlan0|ABSENT||1|1|1|1|1|1|1|1|0|1|1|1}}ARMv7 Processor rev 1 (v7l)|Qualcomm MSM8974PRO-AC|4|Accelerometer|STMicroelectronics|Gravity|Qualcomm}}866500021425311|-|-|1920*1080|12GB|12GB|7c:1d:d9:76:af:f9||wifi}}-|0|-1.0|0|0||79d072a8-59fc-4ace-b45e-1b386d8de712}}0|0|0|-}}Android|com.sankuai.meituan.takeoutnew|5.12.3|19|-|2019-06-25 14:00:34:034}}0.0|0.0|KUNZHIPENG|0c:4b:54:da:bd:80|1|-46|-|-|-|}}

我们来看看这里面包含有什么信息：
手机品牌、型号、安卓版本号、IMEI码、WLAN的MAC地址、热点名称、热点的MAC地址(如图4所示，和路由器铭牌一致)、手机屏幕尺寸、存储空间...
阅读全文 + 去微博评论 +

首页
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
下一页
末页
共 34页503条