java抓取动态生成的数据库

E安全 • 2024年3月25日 19:15:09 • Java • 阅读 33

java爬虫怎么抓取js动态生成的内容

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了-换selector解决

2、有些数据保存在js/json对象中-截取对应的串，分析解决

3、通过api接口调用-伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器

如何抓取网页中的动态数据

首先明确我指的动态数据是什么。

名词定义：动态数据在这里指的是网页中由Javascript动态生成的页面内容，即网页源文件中没有，在页面加载到浏览器后动态生成的。

下面进入正题。

抓取静态页面很简单，通过Java获取到html源码，然后分析源码即可得到想要的信息。如获取中国天气网中杭州的天气，只需要找到对应的html页面()。

假设我需要输入城市名称获取改城市的天气，数据源还是采用中国天气网。首先要做的是根据城市找到对应的页面。通过简单分析发现，城市与页面的URL有对应，如杭州对应101210101，所以程序的关键就是找到城市与页面的对应关系。

发现该网站的搜索框有中国大多数城市的链接，可以得到城市与_id的对应关系。找到突破口，开始行动。进入首页，查看其源代码，找到搜索框所在位置。

原来数据是通过Javascript动态加进去的，用Chrome的inspect element看到以下内容。

目前可以做的是利用Chrome将html复制到文件，然后解析该文件得到城市与URL的关系。问题是万一网站的城市与URL对应关系有变化，这就很被动还需改程序。

现在的问题是如何用Java获取Javascript动态生成的html内容，不知大家有什么看法。

Java_爬虫，如何抓取Js动态生成数据的页面？

用nodejs+puppeteer，解析dom结构获取，或者直接观察返回数据的接口，看能不能直接调用

怎样用java代码动态生成数据库表

Class.forName(“oracle.jdbc.driver.OracleDriver”);

Connection conn=DriverManager.getConnection(“数据库url”,”帐号”,”密码”);

state=conn.createStatement();

state.executeUpdate(“create 建表语句”);

state.executeUpdate(“insert 插入数据”)——插入的值由页面获得，注意字符串拼接。

然后就是关闭连接，state.close();conn.close();

核心代码就是这些，具体应用你可以多写几个方法（增删改查），都是类似的，注意异常的处理，关闭连接最好在finally中进行。

本文来自投稿，不代表【痞子匠】观点，发布者：【E安全】

本文地址：https://www.pizijiang.com/seo/200034.html ，如若转载，请注明出处！

举报投诉邮箱：253000106@qq.com

java 动态数据库

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

E安全作者

64.2K 文章

0 评论

0 粉丝

这个人很懒，什么都没有留下～

java软件工程师现状

上一篇 2024年3月25日 19:13:04

java程序设计题解与上机指导免费在线

下一篇 2024年3月25日 19:21:20

Java

深入java虚拟机pdf,深入java虚拟机中村成洋 pdf

在linux环境下,java怎么实现从word格式转换为pdf格式 //设置当前使用的打印机，我的Adobe Distiller打印机名字为 Adobe PDF wordCom.setProperty( ActivePrinter ， new Variant( Adobe PDF ))；//设置printout的参数，将word文档打印为postscript…

E安全
2024年5月23日
46000
Java

java截取指定长度字符串,java截取指定字符串之后的

java中如何截取字符串中的指定一部分第一个参数是开始截取的字符位置。（从0开始）第二个参数是结束字符的位置+1。（从0开始）indexof函数的作用是查找该字符串中的某个字的位置，并且返回。 int end)；截取s中从begin开始至end结束时的字符串，并将其赋值给s；split讲解：java.lang.string.split split 方法将…

E安全
2024年5月23日
44000
Java

java绑定一个端口,java使用端口

java如何多个service共用一个端口你如果有多个项目的话，你可以把多个项目放到一个tomcat里面，这样端口相同使用项目名称来进行区分项目。你如果非要使用同一个，你也可以配置不同的域名导向不同的项目。就是访问的域名不同转接到的项目不同。如果需要同时启动多个程序，要么修改tomcat的配置文件中的监听端口。要么修改jar包程序的监听端口。不能在一台服…

E安全
2024年5月23日
36000
Java

java多线程并发编程基础,Java多线程并发执行返回

电脑培训分享Java并发编程:核心理论电脑培训发现本系列会从线程间协调的方式（wait、notify、notifyAll）、Synchronized及Volatile的本质入手，详细解释JDK为我们提供的每种并发工具和底层实现机制。人们开始意识到了继承的众多缺点，开始努力用聚合代替继承。软件工程解决扩展性的重要原则就是抽象描述，直接使用的工具就是接口。接…

E安全
2024年5月23日
48000
Java

自学java找工作,自学java找工作需要包装简历吗

自学java学多久可以找到工作 1、自学Java至少需要一年以上的时间才能达到找工作的水平。报班培训四到六个月的时间就可以找到一份不错的工作。 2、自学Java至少需要一年以上的时间才能达到找工作的水平。 3、如果要想找到一份Java相关的工作，需要至少学习5-6个月时间才能就业。Java开发需要掌握一些基础的编程语言知识，比如掌握面向对象的编程思想、基本的…

E安全
2024年5月23日
44000
Java

java左移右移,java 左移

java位移问题 1、思路：直接用Integer类的bit运算操作。 2、移位操作：左移：向左移位，符号后面的数字是移了多少位，移的位用0补齐，例如2进制数01111111左移一位后变为11111110，移位是字节操作。 3、Java 位运算 Java 位运算[转]一，Java 位运算表示方法：在Java语言中，二进制数使用补码表示，最高位为符号位，正数的…

E安全
2024年5月23日
43000
Java

java技术规范,java规范性要求

现在主流的JAVA技术是什么? java最流行开发技术程序员必看 1 、Git Git一直是世界上最受欢迎的Java工具之一，也是Java开发人员最杰出的工具之一。Git是一个开源工具，是-种出色的分布式版本控制解决方案。（1）.Java基础语法、数组、类与对象、继承与多态、异常、范型、集合、流与文件、反射、枚举、自动装箱和注解。（2）.Java面向对象编…

E安全
2024年5月23日
41000
Java

javasocket编程,Java socket编程中,禁用nagle算法的参数

Java进行并发多连接socket编程 1、Java可利用ServerSocket类对外部客户端提供多个socket接口。基本的做法是先创建一个ServerSocket实例，并绑定一个指定的端口，然后在这个实例上调用accept()方法等待客户端的连接请求。 2、Socket socket=server.accept(0；Thread handleThrea…

E安全
2024年5月23日
47000
Java

java死亡,java死代码是什么意思

我的世界传送回死亡点指令是什么? 1、下面就让我们一起来了解一下吧：我的世界回到死的地方的指令是输入/back，就可以回到死亡地点了，当然也可以看信标，因为死亡后会有一道光集中在死亡点，只要循着光就可以找到目的地了。 2、在服务器中的指令首先打开指令台，在指令行输入“/back”就可以回到自己的死亡地点了。在单人游戏中的指令在单人游戏中，您无法直接返回到…

E安全
2024年5月23日
49000
Java

myeclipse能部署java工程么,myeclipse支持jdk18

myeclipse如何建java文件 1、点击【File】—【New】–【Class】在如下界面，输入Class的名字，如Test，点击【Finish】。Test.java文件创建成功。 2、点击【File】—【New】–【Class】在如下界面，输入Class的名字，如Test，点击【Finish】。 Te…

E安全
2024年5月23日
41000