`

(转)获取HTML页面内容后格式化显示的办法

阅读更多

获取html页面内容的方法有很多了,一般都是连接上以后取得页面的内容,然后进行分析。一般用JDK里面提供的  URL和URLConnection 类,就可以实现;当然,也可以用其他工具来实现,比如 httpunit(用这个有时候会有问题,如果页面里面有反盗链的设置或者其他一些有问题的代码,很可能就连接不上了)。 如果单纯只是想得到页面的内容,用JDK里面提供的类就足够。

得到了页面内容以后,怎么显示在我们自己的页面上面呢?特别是要显示在TEXTAREA这样的区域里面就会有点点麻烦。

因为我们获得的内容里面有html标记和javascript标记,或者css标记。

如果直接把这些内容打印出来,或者直接放到TEXTAREA里面,就会报错。。怎么来解决?

一般大家都会想到用字符串来替换,比如 把"<"替换成"[" 等等,或者用正则表达式,来过滤这些标记。

其实有一直很简单方法,就是把得到的页面内容放在<div></div>中间,例如:

<div id="content" style="display:none;">
.........
</div>

然后用javascript来取content,

function show()
{
 form1.content.value = document.getElementById("content").innerText;
}

这样就自动过滤了那些烦人的标记了哦!!

 

分享到:
评论

相关推荐

    formattertattat:学习React,构建JSON格式化程序

    目录自动格式化代码更改页面&lt;title&gt; 安装依赖项导入组件代码分割添加样式表后处理CSS 添加CSS预处理器(Sass,Less等) 添加图像,字体和文件使用public文件夹更改HTML 在模块系统之外添加资产何时使用public...

    AngularJS 日期格式化详解

    AngularJS的日期格式化有两种形式,一种是在HTML页面,一种是在JS代码里,都是用到AngularJS的过滤器$filter

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    JSPExample7.jsp text.html页面提交至该页,并显示提交数据 text.html 页面数据提交至JSPExample7.jsp JSPExample8.jsp 不同类型混合运算自动转换 JSPExample9.jsp 不同类型混合运算强制...

    html页面时间使用

    获取和格式化时间实用笔记1.日期格式化 Date.prototype.format = function(format) { var o = { "M+" : this.getMonth()+1, //month "d+" : this.getDate(), //day "h+" : this.getHours(), //hour "m+" : ...

    helper.rar

    当你访问的接口(打开的页面)返回的是一个JSON格式的数据,FeHelper会自动将内容进行格式化处理,便于您的查看 JSON查看器 把你的JSON代码粘贴到JSON查看器的输入框中,点击“格式化”,在下方便会以非常友好的方式...

    python自动获取网络音乐工具源代码修改版

    此外,我们还可以利用Python的第三方库如BeautifulSoup或者正则表达式来解析页面内容,提取音乐信息并保存到本地文件或数据库中。这样用户可以通过工具快速查找自己喜欢的音乐,建立自己的音乐库。另外,我们还可以...

    100个直接可以拿来用的JavaScript实用功能代码片段(1-10)

    25、原生JavaScript格式化CSS样式代码 26、原生JavaScript压缩CSS样式代码 27、原生JavaScript获取当前路径 28、原生JavaScriptIP转成整型 29、原生JavaScript整型解析为IP地址 30、原生JavaScript实现checkbox全选...

    淘宝已买到的商品数据爬虫.rar

    数据处理和存储:对提取的数据进行进一步处理和清洗,可以进行数据过滤、去重、格式化等操作。然后,根据需求可以将数据保存到文件、数据库或其他数据存储介质中。 页面翻页和动态加载内容处理:当需要跳转到下一页...

    python数据爬取美食网站xpath解析并将美食数据存入csv文件按照人气数据分析可视化

    主要实现了以下功能,实现了以下功能: 爬取数据:代码使用requests库发送HTTP请求,获取美食网站的页面内容。...用户可以通过这段代码快速获取美食网站的数据,进行数据分析和可视化显示人气排名前10的菜品。

    HTML DOM导航「HTML DOM Navigation」-crx插件

    -网页完全加载后,单击页面右上方的“ HTML DOM导航”图标-将鼠标悬停在页面中的任何元素上,以查看IRB格式和元素的前五位祖先-右键单击页面,然后在上下文菜单中选择“ HTML DOM导航-&gt;树格式”选项以查看(整个...

    JSP实用技巧集合,jsp编程的一些小技巧总结

    110.格式化输出数字和字符? 111.生成一定范围的随机数? 112.调用其它应用程序? 113.禁止列出站点文件目录? 114.防止用户直接输入文件名访问JSP? 115.防止表单重复提交? 116.使页面全屏显示? 117.在页面中屏蔽鼠标...

    ActionScript开发人员指南中文版

    动态加载显示内容 显示对象示例:SpriteArranger 第章:使用几何结构 几何结构基础知识 使用Point对象 使用Rectangle对象 使用Matrix对象 几何形状示例:对显示对象应用矩阵转换 第章:使用绘图API 绘制API的基础 ...

    IBM WebSphere Portal门户开发笔记01

    35、更改登录后跳转页面 151 36、PORTAL-LOGIC:IF LOGGEDIN用户是否登录与注销 152 37、引入主题头部输出连接部分 152 九、IBM WEBSPHERE PORTAL 主题与皮肤开发 153 一、初级入门:Portal的主题与皮肤开发: 153 二...

    php常用工具类,包含了JS弹窗,页面跳转,系统基本参数上传图片,html过滤,数据库输入过滤,清理session,各种验证,

    一个php常用的工具类,它包含了JS弹窗,页面跳转,系统基本参数上传图片,html过滤,数据库输入过滤,清理session,各种验证,格式化,获取ip地址,加载模板,图片水印,文件操作等等很多实用的功能工具,方便大家...

    从入门到精通HTML5——PDF——网盘链接

     1.4.3 使用可视化软件制作页面 10  1.4.4 使用浏览器浏览HTML文件 14  1.4.5 使用HTML开发的明日图书网 14  1.5 小结 15  1.6 习题 16  第2章 HTML文件基本标记 17  教学录像:44分钟  2.1 HTML头部标记 18...

    HTML5与CSS3基础教程(第8版)高清文字

    4.14 使用预格式化的文本 84 4.15 突出显示文本 85 4.16 创建换行 87 4.17 创建span 88 4.18 其他元素 89 第5章 图像 95 5.1 关于Web图像 95 5.2 获取图像 99 5.3 选择图像编辑器 100 ...

Global site tag (gtag.js) - Google Analytics