用python如何直接获取jsp生成的验证码图片?Java源码 实现网络爬虫
本文目录
用python如何直接获取jsp生成的验证码图片
你只需要正常请求图片就行了,分析一下image的src,把它拼接成一个完整的URL去请求就好了,得到的有可能是BASE64编码串,或者是文件,把它保存下来就可以了。
Java源码 实现网络爬虫
//Java爬虫demo import java.io.File;import java.net.URL;import java.net.URLConnection;import java.nio.file.Files;import java.nio.file.Paths;import java.util.Scanner;import java.util.UUID;import java.util.regex.Matcher;import java.util.regex.Pattern; public class DownMM { public static void main(String args) throws Exception { //out为输出的路径,注意要以\\结尾 String out = "D:\\JSP\\pic\\java\\"; try{ File f = new File(out); if(! f.exists()) { f.mkdirs(); } }catch(Exception e){ System.out.println("no"); } ***隐藏网址*** Pattern reg = Pattern.compile("《img src=\"(.*?)\""); for(int j=0, i=1; i《=10; i++){ URL uu = new URL(url+i); URLConnection conn = uu.openConnection(); conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko"); Scanner sc = new Scanner(conn.getInputStream()); Matcher m = reg.matcher(sc.useDelimiter("\\A").next()); while(m.find()){ Files.copy(new URL(m.group(1)).openStream(), Paths.get(out + UUID.randomUUID() + ".jpg")); System.out.println("已下载:"+j++); } } }}
百度爬虫能爬到jsp页面的诶荣吗
JSP页面在浏览器上显示的只是html页面,你要爬网页内容和后台脚本无关。可以的
更多文章:
有哪些比较准确的手机地图导航软件?国内自驾游使用哪种导航最靠谱
2024年7月1日 07:52
绿松石为什么那么贵(怎么盘绿松石才正确 绿松石为什么那么贵)
2024年7月25日 11:46
importance的形容词(important有没有什么变化形式,比如ing形式或过去式等等,能把你知道的都写出来吗)
2024年7月15日 11:27
滑块轴承调节器(滑动轴承中的有一种是自动调心轴承,一般用在什么地方,举一些具体的例子)
2024年7月22日 04:20
数据分析师八大能力培养(什么类指标是电子商务数据监控的核心之一)
2024年6月26日 10:17
c语言12345输出54321(输入一个整数,将其逆序输出,去(输入12345输出54321)这道题怎么做啊求解)
2024年7月24日 01:21
strcmp函数会忽略大小写吗(if(strcmp(ch,“Y“)==0||strcmp(ch,“y“)==0))
2024年6月2日 02:20
snap翻译成中文(中国古代文言文言简意赅,为什么要发展成现代白话罗啰嗦嗦)
2024年6月6日 02:23
正则表达式6位数字怎么写(java 三位字母加6位数字的正则表达式怎么写)
2024年7月23日 23:14
企业微信直播一直数据加载中(进入企业微信直播显示数据加载中)
2024年7月11日 11:41
dede模板文件(dede网站 站内搜索时提示“模板文件不存在,无法解析”是怎么回事那位大师给指点一下)
2024年6月25日 07:39
concerta(Cash Cash的《Concerta》 歌词)
2024年7月10日 13:29
哈夫曼树的叶子结点怎么算(n个叶子结点的哈夫曼树有多少个结点)
2024年8月7日 00:05