网页源码p标记内容提取

(若本贴违规,请管理员删帖,谢谢!)

之前在准备公考,于是在网上找了一些考申论可能用得上的素材,然后发现有的网站复制文字素材还需要扫码登陆,感觉挺麻烦的。
于是打算做了一个简单的工具来复制文字。

名称:网页源码p标记内容提取
版本:0.1.0.2 alpha版

更新说明:
1、修改 程序图标;
2、优化 屏蔽词算法;
3、新增 UTF8和GB2312编码读取方式选择;
4、优化 内容提取算法;
5、新增 仅提取源码;
6、修改 屏蔽词的正则表达式处理。

本软件目前只能在win10 系统运行!

图片[1] - 网页源码p标记内容提取 - 宋马
视频教程戳这里!
使用方法:
一、直接复制网址
这里以网址http://www.sc1618.com/shici/39251.html为例,

网页源码p标记内容提取

这里的素材看上去不错,用在申论的文章应该OK,于是打算复制一下了。
复制这个网址到地址栏,然后单击“提取”,稍等片刻,可以看到结果。

网页源码p标记内容提取

二、导入离线网页
有的网站需要保存离线网页才能复制到内容。这里以http://www.ccutu.com/261312.html为例,
先在网页上找到

网页源码p标记内容提取

然后点击展开。
之后右键网页,另存为网页到电脑上。

网页源码p标记内容提取

然后点击导入

网页源码p标记内容提取


把离线网页导入进来后,单击“提取”即可。

网页源码p标记内容提取

有的文字不是在p标记里面的,这种情况我无能为力。

图片[1] - 网页源码p标记内容提取 - 宋马
下载方式:
1、论坛直接下载:

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 共38条

请登录后发表评论