系统下载、安装、激活,就到系统天地来!

所在位置: 首页 — 系统文章 — office教程

紊乱的网络文章转存为Word文档的技巧

作者:电脑软件 日期:2017-09-09

 

平时我们经常会在网上复制一些精彩文章保存,不过网络文章格式非常紊乱。比如文章标点全角/半角混用,段落设计不合理、字体多种多样等,这给我们后续阅读带来极大的不便。如何快速将这些不规范的元素去除,形成一篇规范化的文章?其实只要借助我们常用的Word即可实现,下面以Word 2016为例 。

小提示:

因为网上内容大多使用Html代码,为了实现更纯净的格式,在选择网页内容复制后,在Word要使用“开始→粘贴→只保留文本”的方式粘贴纯文本内容,然后再执行下面的排版内容。

半角/全角一步替换

大家知道输入法分为全角和半角输入,网上很多文章在输入时都会在意全角/半角的区别,这样复制的文章经常半角/全角混用,全角字符占用更多字符,看起来也不够美观。如果复制的文章存在这种现象,我们可以使用Word的自带组件快速完成替换。

首先将复制文档全部粘贴到Word,全选复制的文档,点击“开始→Aa(更改大小写)→半角”,这样文章中原来全角字符即可改为半角(图1)。

 

紊乱的网络文章转存为Word文档的技巧1.png

图1 更改全角为半角

 

在Word更改大小写菜单可以看到其还包含“句首字母大小写”、“每个单词首字母大写”等常用的英文书写规范,同样可以用它来快速规范文章格式。比如上述例子,很多单词首字母大写就没有规范,同上选择正文内容(不含http链接内容),点击“每个单词首字母大写”即可(图2)。

 

紊乱的网络文章转存为Word文档的技巧2.png

图2 快速设置每个单词首字母大写

 

一键删除乱码

一些网站为了阻止我们任意复制文章,从其中复制下来的文章粘贴到记事本后经常会出现很多不规则的乱码,这些乱码大多附在段落的最后(图3)。

 

紊乱的网络文章转存为Word文档的技巧3.png

图3 文章复制到记事本后出现乱码

 

不过这些乱码在Word中显示不明显,因为这些乱码字体的颜色被设置为白色(和Word底色一致)。对于这些乱码文字的删除,可以使用“查找替换功能”。在Word中按 Ctrl+H 打开“查找和替换”窗口,展开替换的高级功能,接着点击“格式”下的“字体……”,在打开的“字体”窗口中,展开 “全部文字”中的“字体颜色”内的“下拉菜单”,选择其中的“白色”(图4)。

 

紊乱的网络文章转存为Word文档的技巧4.png

图4 选择白色字体

 

返回替换窗口,替换为留空,点击“全部替换”,这样那些文后的乱码文件就可以全部删除了(图5)。

 

紊乱的网络文章转存为Word文档的技巧5.png

图5 通过字体颜色查找和替换

 

删除多余空格和空行

网上复制的文章经常会包含大量的空格和空行,同样对于这类元素的删除也是通过查找和替换来批量删除。

对于空格的形成主要有半角、全角和制表符造成的,我们只要使用相应的代码进行替换即可。比如制表符的空格,打开查找和替换窗口,单击对话框中的“高级”按钮,然后单击“特殊字符”,选择“制表符”,在“查找内容”框中会出现“^t”,然后替换为留空,这样即可删除制表符形成的空格(图6)。

 

紊乱的网络文章转存为Word文档的技巧6.png

图6 删除制表符空格

 

对于空行的删除,点击两次“特殊字符”中的“段落标记”,“查找内容”框中将出现两个“^p”,替换为输入一个“^p”,再单击“全部替换”,文档中所有的空段全部消失(可以执行多次替换),可以看到替换前后文章结构完全不同(图7)。

 

紊乱的网络文章转存为Word文档的技巧7.png

 

中英文标点互换

网上很多文章都是中英文标点符号混用,这样我们需要对其进行统一转换。水平较高用户可以自制宏来进行批量替换。普通用户则可以借助“Word必备工具箱”来实现批量替换。在Word打开需要排版的文章,点击“工具箱→英文标点或者中文标点”,这样即可轻松完成转换(图8)。

 

紊乱的网络文章转存为Word文档的技巧8.png

图8 通过专业插件完成标点转换

 

当然我们还可以用它来实现更多排版操作,比如需要从网上复制很多文章保存。那么对于通用的替换则可以通过“Word必备工具箱”进行批量替换,点击“多文档查找与替换”,在弹出窗口输入需要查找和替换内容,选择文档所在目录,这样即可快速实现多个文档的替换(图9)。

 

紊乱的网络文章转存为Word文档的技巧9.png

图9 批量文档替换

 

写在最后

可以看到Word进行排版的主要手段就是借助查找和替换表达式进行批量删除,由于每篇具体文章不同,大家可以根据实际情况使用更多正则表达式进行删除。比如删除两个非字母之间的半角空格,查找“([!a—zA—Z])^32([!a—zA—Z])”替换为“12”,删除英文句号、中文句号、英文引号、中文引号后的段落标记,查找“([!。。”“])^13”替换为”1"即可。当然为了提高排版操作效率,还可以通过Word插件来完成更多批量替换操作。