站内搜索: 请输入搜索关键词

当前页面: 开发资料首页J2SE 专题关于解析html源代码的问题?

关于解析html源代码的问题?

摘要: 关于解析html源代码的问题?


最近我要写一个模拟网络爬虫的程序.但是我不知道在html源文件里,怎么提取出链接.超级键连的标志是什么?因为有些键连不是绝对路径的,只是相对路径.希望高手能够告诉.我原来是只提取http:// 开头的,但是不完全.希望高手能够告诉.此外,如果想用正则表达式的话,怎么表示?
谢谢!!!


里面的 ?


就是网页源文件里面的.我是用java写程序的.对html语言不是很熟悉!!


写Java程序的,基本上对HTML的掌握是基本功,因为用Java做B/S的实在太普遍了


网上有现成的库.


我是初学者,刚学到网络部分.大家帮帮我.楼上的,是什么库呢?



俺也是初入门者,帮你UPUP


我觉得,你连HTML语法都不熟悉,怎么搞JAVA呢?



html库 搜一下 html标签
你说的超链接 就是
标签 你说的是它吧



使用htmlparser,它带有你需要的示例代码,目前最高版本1.6


见意你先好好学习html
再结合正则,处理这些,才会得心应手!


用htmlparser,简单好用。


我现在 也在弄这种东西 就是在html 中找连接不明不白的
能给个小例子吗???? 帮帮忙啊 !!!


↑返回目录
前一篇: 如何在java中操作word?
后一篇: 请问如何发出一条Terminal(Mac机中命令行界面,linux命令行)指令,高手帮忙,100分!