上一页下一页

清理 Microsoft Word HTML

在 Dreamweaver 中,可以打开或者导入在 Microsoft Word 中保存为 HTML 文件的文档,然后使用“清理 Word 的 HTML”命令删除 Word 生成的无关 HTML 代码。Dreamweaver 删除的代码主要是 Word 用来格式化和显示 Word 文档的,在显示 HTML 文件时并不需要。保留原始 Word (.doc) 文件的一份拷贝作为备份,因为一旦应用了“清理 Word 的 HTML”功能,可能就无法在 Word 中再次打开 HTML 文档。“清理 Word 的 HTML”命令适用于被 Word 97 或更高版本保存为 HTML 文件的文档。

若要清理不是由 Microsoft Word 生成的 HTML 或 XHTML,请参阅清理代码

清理 Word 的 HTML:
  1. 在 Microsoft Word 中,将文档另存为 HTML 文件。
  2. 在 Dreamweaver 中,使用下列方法之一打开 HTML 文档:
    • 选择“文件” >“导入”>“导入 Word HTML”,然后选择要打开的文件。
    • Dreamweaver 打开文件,然后自动打开“清理 Word 的 HTML”对话框。

    • 选择“文件” >“打开”,然后选择要打开的文件。
    • 如果在“HTML 代码改写”参数选择中选择了“修正或删除标签时发出警告”,则将自动生成 HTML 校正日志文件。这不属于“清理 Word 的 HTML”功能。单击“继续”退出对话框。然后,在 Dreamweaver 中,选择“命令”>“清理 Word 的 HTML”。

  3. 不论使用这两种方法的哪一种,在 Dreamweaver 试图确定文件是用 Word 的哪个版本保存的时,可能都会有一点延迟。如果 Dreamweaver 无法确定这一点,请使用弹出菜单选择正确的版本。
  4. 选择“清理 Word 的 HTML”功能应该使用的选项。“基本”选项卡显示下列选项:
    • 删除所有 Word 特定的标签删除所有 Word 特定的 HTML,包括html 标签中的 XML、文档头中的 Word 自定义元数据和链接标签、Word XML 标签、条件标签及其内容以及样式中的空段落和边距。可以使用“详细”选项卡分别选择这些选项。
    • 清理 CSS删除所有 Word 特定的 CSS,包括尽可能地移除内联 CSS 样式(当父样式有相同的样式属性时)、以 “mso”开头的样式属性、非 CSS 样式声明、表格中的 CSS 样式属性以及头中所有未使用的样式定义。使用“详细”选项卡可以进一步自定义此选项。
    • 清理< font >标签删除 HTML 标签,将默认的正文文本转换成 2 号字的 HTML 文本。
    • 修复无效的嵌套标签删除由 Word 在段落和标题(块级)标签外部插入的 font 标签。
    • 设定背景颜色允许输入十六进制值设置文档的背景颜色。如果不设定背景颜色,Word HTML 文档的背景颜色将是灰色的。Dreamweaver 设置的默认十六进制为白色。
    • 套用源格式将“HTML 格式”参数选择和 SourceFormat.txt 中指定的源格式选项应用于文档。
    • 完成时显示动作记录清理完成时显示一个警告框,其中包含有关文档改动的详细信息。
  5. 单击“确定”。
  6. 根据文档大小和所选选项数目的不同,可能需要几秒钟完成清理。您输入的参数选择自动保存为默认的“清理 Word 的 HTML”设置。


  上一页下一页