Word 文档生成 PDF 的过程中,PDF 文件,应该「保存为」还是「打印为」?

Word 文档生成 PDF 的过程中,PDF 文件,应该「保存为」还是「打印为」?


最近在使用 Word 文档生成 PDF 的过程中,遇到了一个有关字体嵌入的问题,进而让我开始考虑 PDF 文件的创建方式。当我们需要使用某种格式的文档(例如 Word 的 .docx)创建一份 PDF 的时候,到底该通过「保存」还是「打印」的方式进行呢?

「保存」和「打印」,效果好像是类似的

记得大概是从 Office 2007 开始,可以额外安装一个免费的加载项,直接在 Office 应用中把文档「保存」成 PDF 格式。从 Office 2013 开始,该功能进一步完善,直接成为一个内置功能,无需安装任何额外的软件就可以把文档保存成 PDF 格式。Word、PowerPoint、Excel 均可支持。更方便的是,Word 2013 开始可以直接打开/编辑 PDF 格式的文档。

新版 Office 应用已经可以直接将文档保存成 PDF 格式

除此之外还有另一种方式,给系统中安装虚拟打印机软件,将文档「打印」成 PDF 格式。类似这样的第三方工具非常多,有免费的,也有收费的,而 Windows 10 更是直接内建了一个名为「Microsoft Print to PDF」的虚拟打印机。这种方式的通用性更强,任何程序只要支持打印,就能将程序中创建的文档转换为 PDF 格式。

Windows 10 自带的 PDF 虚拟打印机

那么为啥非要用 PDF 格式?

先来考虑一下为啥要用 PDF 格式吧。其实只要把 PDF 格式理解为「纸质文档」的数字化版本,一切就清楚了。

当然还有其他一些优势,不过我接触不多,也就不详细展开说了。PDF 格式在很多场合还是挺有用的。所以就产生了下一个问题:

到底是要「保存」还是「打印」?

对于新版 Office 软件这种既能在软件内部将文档「另存为」PDF 格式,又能借助 PDF 虚拟打印机将文档「打印」成 PDF 格式的程序,到底哪种方式更好?

简单来说,「保存」的 PDF 文档,依然会尽量维持文档的一些「数字化格式」属性;而「打印」的 PDF 文档会尽量类似于传统的纸质文档,在真正的「纸张」上无法获得的功能,在「打印」的 PDF 文档中一样无法获得。

啥意思呢?

超级链接

超级链接是数字化世界里一个最显著的特征。假设文稿中需要包含超级链接,考虑下面这个例子:

「这里」两个字的颜色和其他文字不同,并增加了下划线。直接点击这个文字可以打开一个网页。包含上述这行文字的文稿在「保存」成 PDF 格式后,PDF 中这两个字点击后依然是有效果的;但如果通过「打印」的方式创建 PDF 文档,虽然这两个字依然会显示为不同颜色,包含下划线,看起来是个超级链接,不过实际点击后不会有任何效果。本应如此啊,用手指猛戳纸张上的文字,你指望能产生什么效果呢!为了让「打印」的PDF 也能呈现链接内容,就只能将文稿中的内容改成下面这样:

但是依然不能点击哦!你的读者只能手工选中括号里的链接文本,复制并粘贴到浏览器中查看。

书签

对于篇幅比较长的 Word 文档,带有层次结构的标题是个很好的功能,不仅可以方便地在不同章节之间定位和跳转,还能用简单的操作生成可点击的目录。例如有这样一份文稿:

包含层次结构的文稿

将这样的内容「打印」成 PDF 后,虽然字体字号等文字样式都还在,但所有标题的层次结构(以及其他所有非「可打印」信息)都会丢失,如果要查看的是一份几百上千页的文档,慢慢翻找吧…

「打印」的 PDF 文件会丢掉一些「数字化」特征

如果是直接「保存」而来的 PDF,情况将完全不同,保存的时候通常可以选择是否创建书签,而这样创建的 PDF 也很好地保留了文档的一些「数字化」特征。例如下图最上层的对话框就是在 Word 2016 中将文档「保存」为 PDF 时可以设置的选项。

「保存」的 PDF 可以尽量保留文稿不可打印的特征

这两种方式创建的 PDF 文档还有其他一些差异,不过我暂时还没遇到。例如在研究这个问题时,发现有人提到过在同一个程序中使用这两种方式创建 PDF 文稿,其中一种创建的 PDF 中图片等内容的质量较高,而另一种的较差等。没有具体遇到,所以暂时不知道是为啥。反正方法有两种,自己尝试一下,看哪种更好,更适合自己吧。

接下来我想说说导致我考虑这个问题的原因,因为我在使用过程中遇到了一个很奇怪的情况。

不同创建方式,字体的处理也有差异

最近我接触到一种新字体:汉仪旗黑。我个人挺喜欢这种字体的,于是最近处理的一些 Word 文档中开始使用这个字体。但在将使用这种字体的文档以「保存」的方式转换为 PDF 之后发现,所有应用了汉仪旗黑的文字都没能将字体嵌入到文档中,而是以「图片」形式嵌入的;但是以「打印」方式创建的话,应用了汉仪旗黑的文字就可以正常地以「文本」形式呈现在 PDF 中。

至今还不知道原因,不知道谁有啥见解。具体的软件环境如下:

Windows 10 Pro Build 14342 x64,Word 2016 (16.0.6925.1014) x64,Acrobat Reader DC (2015.016.20041)。

在 Word 2016 创建的文稿中使用了下列两个字体,根据属性来看,应该都是可以嵌入文档的:

文档中使用了两种字体

在 Word 2016 中建立一个文档,输入下图所示内容,并分别应用上面这两种字体,同时设置 Word 的选项允许嵌入字体:

Word 文档的实际内容

直接使用 Word 2016 将文档「保存」为 PDF 格式:

用「保存」的方式创建 PDF

随后用 Acrobat Reader DC 打开生成的文档。发现应用了微软雅黑字体的第一行文字,所有内容可以选中,并可复制为文字。但应用了汉仪旗黑的第二行文字,只有其中的英文部分可以选中并复制为文字,中文字符部分是图片:

应用微软雅黑的文字可以「文本」方式选中和复制

应用汉仪旗黑字体的文字是以「图片」方式呈现的

进一步查看该 PDF 文件的属性,发现汉仪旗黑字体根本没有嵌入。

汉仪旗黑字体并未嵌入文档

由于是以图片形式嵌入,这样的文件在放大之后显示效果变得非常差(具体效果请点击看大图):

放大之后,「图片文字」的显示效果惨不忍睹

就算不放大,按照 100% 的比例显示,在某些 PDF 阅读器,例如 Windows 10 Edge 浏览器,以及微软的「阅读器」应用中,图片形式的文字看起来发虚(效果请点击看大图):

某些情况下,「图片文字」会显得很虚

我有文字洁癖,这样的情况无法忍受…

以往使用其他字体生成的 PDF 文件似乎并没有出现过类似的问题,只有汉仪旗黑,准确来说,是汉仪旗黑中的中文字符(第二行应用了汉仪旗黑的文字中,后面的英文字符依然是可以选中和复制的),无法以文字形式连同字体一起嵌入到 PDF 中。不知道这是 Word 的问题,还是汉仪旗黑字体的问题,或者 PDF 格式本身的问题。

同一份文稿,使用 Windows 10 自带的 Microsoft Print to PDF 「打印」成 PDF 后,应用汉仪旗黑的文字会呈现为可选择,可复制的文字 ,同时 PDF 文件的属性中显示嵌入了下列字体,估计这是虚拟打印机的驱动对内容进行处理后造成的。虽然字体名称变了,但至少可以正确显示。

「打印」的方式可以嵌入字体

题外话:汉仪旗黑这个字体真心不错,挺漂亮的。网上有很多介绍,例如这里。难能可贵的是,个人用途可以免费使用该字体。关注微信公众号「汉仪字库」,回复「汉仪旗黑」就可以获得下载链接。好东西,还免费,我愿意给他们安利一下。


本文摘自:https://www.office26.com/word/word_4646.html,感谢原作者!

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享