apache maven 3.0.4:如何提取网页表格中的数据

来源:百度文库 编辑:杭州交通信息网 时间:2024/04/29 03:41:01
很多私服网站上提供私服小偷的连接,但是都是带表格格式的连接,我只想把里面的数据提取出来,按自己的设置放到我的网站上,我该怎么做呢?用查看源文件的方式能提取出来,但是再编辑,再导入我的数据库很麻烦,总是花费大量的时间,有没有什么办法可以对这些文件进行批处理的?或者不用这种方式,高手请指教,小弟是新手。举个例子,比如好私服www.haosf.com查看源文件之后得到的数据是用逗号和引号分隔的,我用EXCEL编辑,再导如ACCESS数据库,一般麻烦吧,不过人家要是总更新我就累惨了。还有很多网站查看源文件之后就带着格式的,我的网站www.allsifu.com就是这样的,格式是<td>....〈/td〉这种格式的,而且一条信息分好几行,我真是不知道这样的信息怎么提取,大哥们帮忙,我是新手,就30分了,都拿出来了,别嫌少啊!
可能是我苯,没说明白,怎么才能自动提取这些信息呢?

不用那麻烦啦。
选中你要的表格数据,复制后粘贴到Excel里,然后你就可以将它们导入自己的数据库中了,比如保存为某种格式的数据等,不会带上那些用不着的格式。

做小偷肯定要辛苦点啦,除非你能做一个自动偷别人网站数据放到你网站数据库的程序。

安装printpage2003版本,这样你ie工具栏里就有一个可编辑按钮
你可以切换到printpage并用它直接打开当前的网页
剩下的自己看着改吧