内容
CSV (逗号分隔值)是一种以纯文本形式存储表格数据(数字和文本)的常用格式。 由于大量程序和应用程序都理解 CSV,这种文件格式很受欢迎且经久不衰,至少作为导入/导出的替代文件格式。 此外,CSV 格式允许用户查看文件并立即发现数据问题,如果有问题,更改 CSV 分隔符、引用规则等。 这是可能的,因为 CSV 是一个简单的文本,即使不是很有经验的用户也可以轻松理解它而无需特殊培训。
在本文中,我们将学习将数据从 Excel 导出为 CSV 的快速有效的方法,并学习如何将 Excel 文件转换为 CSV,而不会扭曲所有特殊字符和外来字符。 本文中描述的技术适用于 Excel 2013、2010 和 2007 的所有版本。
如何将 Excel 文件转换为 CSV
如果要将 Excel 文件导出到其他应用程序,例如 Outlook 通讯簿或 Access 数据库,请先将 Excel 工作表转换为 CSV 文件,然后再导入文件 . CSV 到另一个应用程序。 以下是有关如何使用 Excel 工具将 Excel 工作簿导出为 CSV 格式的分步指南 - “除上文所“。
- 在 Excel 工作簿中,打开选项卡 文件 (文件)并单击 除上文所 (另存为)。 此外,对话框 保存文档 (另存为)可以通过按键打开 F12.
- 在 文件类型 (另存为类型)选择 CSV(以逗号分隔) (CSV(逗号分隔))。除了 CSV(逗号分隔)之外,还有其他几个 CSV 格式选项可用:
- CSV(以逗号分隔) (CSV(逗号分隔))。 此格式将 Excel 数据存储为逗号分隔的文本文件,并可在另一个 Windows 应用程序和不同版本的 Windows 操作系统中使用。
- CSV(麦金塔). 此格式将 Excel 工作簿另存为逗号分隔文件,以便在 Mac 操作系统上使用。
- CSV(MS DOS). 将 Excel 工作簿另存为逗号分隔文件,以便在 MS-DOS 操作系统中使用。
- 统一码文本 (Unicode 文本 (*txt))。 几乎所有现有操作系统都支持该标准,包括 Windows、Macintosh、Linux 和 Solaris Unix。 它支持几乎所有现代甚至一些古代语言的字符。 因此,如果Excel工作簿包含外文数据,我建议您先将其保存为格式 统一码文本 (Unicode 文本 (*txt)),然后转换为 CSV,如后面从 Excel 导出为 UTF-8 或 UTF-16 CSV 格式中所述。
请注意: 所有提到的格式只保存活动的 Excel 工作表。
- 选择一个文件夹来保存 CSV 文件,然后单击 保存 (保存)。按下后 保存 (保存)会出现两个对话框。 不用担心,这些消息并不表示错误,应该是这样的。
- 第一个对话框提醒您 只有当前工作表可以保存在所选类型的文件中 (所选文件类型不支持包含多个工作表的工作簿)。 要仅保存当前工作表,只需按 OK.如果要保存该书的所有页,请单击 消除 (取消)并使用适当的文件名单独保存书籍的所有页面,或者您可以选择保存另一种支持多页的文件类型。
- 点击后 OK 在第一个对话框中,将出现第二个对话框,警告某些功能将不可用,因为它们不受 CSV 格式的支持。 这就是它应该的样子,所以只需点击 Yes (是的)。
这就是如何将 Excel 工作表保存为 CSV 文件的方式。 快速简单,这里几乎不会出现任何困难。
使用 UTF-8 或 UTF-16 编码从 Excel 导出到 CSV
如果 Excel 工作表包含任何特殊或外来字符(波浪号、重音符号等)或象形文字,则以上述方式将 Excel 工作表转换为 CSV 将不起作用。
重点是团队 除上文所 > CSV (另存为 > CSV)将破坏除 ASCII(美国信息交换标准代码)之外的所有字符。 如果 Excel 工作表上有双引号或长破折号(例如,复制/粘贴文本时从 Word 文档传输到 Excel),这些字符也会被切碎。
简单的解决方案 - 将 Excel 工作表另存为文本文件 统一码(.txt),然后将其转换为 CSV。 这样,所有非 ASCII 字符都将保持不变。
在继续之前,让我简要解释一下 UTF-8 和 UTF-16 编码之间的主要区别,以便在每种情况下您都可以选择合适的格式:
- UTF-8 是一种更紧凑的编码,每个字符使用 1 到 4 个字节。 当文件中以 ASCII 字符为主时,通常建议使用这种格式,因为这些字符中的大多数需要 1 个字节的内存。 另一个优点是仅包含 ASCII 字符的 UTF-8 文件的编码与同一个 ASCII 文件没有任何不同。
- UTF-16 使用 2 到 4 个字节来存储每个字符。 请注意,并非在所有情况下 UTF-16 文件都比 UTF-8 文件需要更多的内存空间。 例如,日文字符在 UTF-3 中占用 4 到 8 个字节,在 UTF-2 中占用 4 到 16 个字节。 因此,如果数据包含亚洲字符,包括日文、中文和韩文,则使用 UTF-16 是有意义的。 这种编码的主要缺点是它与 ASCII 文件不完全兼容,并且需要特殊的程序来显示这些文件。 如果您计划从其他地方的 Excel 导入生成的文件,请记住这一点。
如何将 Excel 文件转换为 CSV UTF-8
假设我们有一个带有外来字符的 Excel 表,在我们的示例中它们是日文名称。
要将此 Excel 工作表导出为 CSV 文件,同时保留所有象形文字,我们将执行以下操作:
- 在 Excel 中,打开选项卡 文件 (文件)并单击 除上文所 (另存为)。
- 在字段中输入文件名 文件类型 (另存为类型)选择 统一码文本 (Unicode 文本 (*.txt)) 并单击 保存 (保存)。
- 在任何标准文本编辑器(例如记事本)中打开创建的文件。
请注意: 并非所有简单的文本编辑器都完全支持 Unicode 字符,因此有些可能会显示为矩形。 在大多数情况下,这不会以任何方式影响最终文件,您可以简单地忽略它或选择更高级的编辑器,例如 Notepad++。
- 由于我们的 Unicode 文本文件使用制表符作为分隔符,并且我们想将其转换为 CSV(逗号分隔),因此我们需要将制表符替换为逗号。
请注意: 如果没有严格要求获取带有逗号分隔符的文件,但您需要 Excel 可以理解的任何 CSV 文件,则可以跳过此步骤,因为 Microsoft Excel 可以完美理解带有分隔符的文件 - 制表。
- 如果您仍需要 CSV 文件(以逗号分隔),请在记事本中执行以下操作:
- 选择制表符,右键单击它,然后在上下文菜单中单击 复制 (复制),或者直接点击 按Ctrl + C如下图所示。
- 媒体 Ctrl + H打开对话框 替代 (替换)并将复制的制表符粘贴到字段中 那个 (找什么)。 在这种情况下,光标将向右移动——这意味着插入了一个制表符。 现场 比 (替换为)输入逗号并按 全部替换 (全部替换)。
在记事本中,结果将是这样的:
- 点击 文件 > 除上文所 (文件 > 另存为),输入文件的名称并在下拉列表中 喷码 (编码)选择 UTF-8… 然后按下按钮 保存 (保存)。
- 启动 Windows 资源管理器并更改文件扩展名 。文本 on . CSV.以不同的方式更改扩展名 。文本 on . CSV 您可以直接在记事本中进行操作。 为此,在对话框中 除上文所 (另存为)在字段中 文件类型 (另存为类型)选择一个选项 所有文件 (所有文件),并在相应字段的文件名中添加“.csv”,如下图所示。
- 在 Excel 中打开 CSV 文件,为此,在选项卡上 文件 (菲力)揉 可选 > 文本文件 (打开 > 文本文件)并检查数据是否正常。
请注意: 如果您的文件打算在 Excel 之外使用并且需要 UTF-8 格式,则不要对工作表进行任何更改,也不要在 Excel 中再次保存,因为这可能会导致读取编码出现问题。 如果某些数据没有在 Excel 中显示,请在记事本中打开相同的文件并更正其中的数据。 不要忘记再次以 UTF-8 格式保存文件。
如何将 Excel 文件转换为 CSV UTF-16
导出到 UTF-16 CSV 文件比导出到 UTF-8 更快、更容易。 事实上,当您将文件另存为时,Excel 会自动应用 UTF-16 格式 统一码文本 (Unicode 文本)。
为此,请使用该工具保存文件 除上文所 (另存为)在 Excel 中,然后在 Windows 资源管理器中,将创建的文件的扩展名更改为 . CSV。 做完了!
如果您需要使用分号或分号作为分隔符的 CSV 文件,请在记事本或您选择的任何其他文本编辑器中分别用逗号或分号替换所有制表符(有关如何执行此操作的详细说明,请参阅本文前面的内容)。
将 Excel 文件转换为 CSV 的其他方法
上述用于将数据从 Excel 导出为 CSV(UTF-8 和 UTF-16)的方法是通用的,即适用于处理任何特殊字符以及从 2003 年到 2013 年的任何版本的 Excel。
还有许多其他方法可以将数据从 Excel 转换为 CSV 格式。 与上面显示的解决方案不同,这些方法不会产生纯 UTF-8 文件(这不适用于 OpenOffice,它可以以多种 UTF 编码选项导出 Excel 文件)。 但在大多数情况下,生成的文件将包含正确的字符集,然后可以使用任何文本编辑器轻松地将其转换为 UTF-8 格式。
使用 Google 表格将 Excel 文件转换为 CSV
事实证明,使用 Google 表格将 Excel 文件转换为 CSV 非常容易。 如果您的计算机上已经安装了 Google Drive,请按照以下 5 个简单步骤操作:
- 在 Google 云端硬盘中单击按钮 创建 (创建)并选择 表 (电子表格)。
- 在菜单上 文件 (菲力)揉 进口 (进口)。
- 点击 下载 (上传)并选择要从您的计算机上传的 Excel 文件。
- 在对话框中 恶魔文件排序 (导入文件)选择 更换表 (替换电子表格)并单击 进口 (进口)。
提示: 如果 Excel 文件相对较小,那么为了节省时间,您可以使用复制/粘贴将数据从它传输到 Google 电子表格。
- 在菜单上 文件 (菲力)揉 下载为 (下载为),选择文件类型 CSV – 文件将保存在计算机上。
最后,在任何文本编辑器中打开生成的 CSV 文件,以确保正确保存所有字符。 不幸的是,以这种方式创建的 CSV 文件并不总是在 Excel 中正确显示。
将 .xlsx 文件另存为 .xls,然后转换为 CSV 文件
此方法不需要任何额外的注释,因为从名称中已经可以清楚地了解所有内容。
我在一个专门针对 Excel 的论坛上找到了这个解决方案,我不记得是哪一个了。 说实话,我没用过这种方法,但是很多用户反映,直接保存时会丢失一些特殊字符 . XLSX в . CSV, 但如果先保留 . XLSX 保存为 的.xls,然后喜欢 . CSV,就像我们在本文开头所做的那样。
无论如何,请尝试使用这种从 Excel 中创建 CSV 文件的方法,如果可行,那将是一个很好的节省时间的方法。
使用 OpenOffice 将 Excel 文件保存为 CSV
OpenOffice 是一个开源应用程序套件,其中包括一个电子表格应用程序,该应用程序可以很好地将数据从 Excel 导出为 CSV 格式。 事实上,在将电子表格转换为 CSV 文件(编码、分隔符等)时,此应用程序让您可以访问比 Excel 和 Google 表格加起来更多的选项。
只需在 OpenOffice Calc 中打开 Excel 文件,单击 文件 > 除上文所 (文件 > 另存为)并选择文件类型 CSV 文本 (文本 CSV)。
下一步是选择参数值 喷码 (字符集)è 字段分隔符 (字段分隔符)。 当然,如果我们要创建一个以逗号作为分隔符的 UTF-8 CSV 文件,那么选择 UTF-8 并在相应的字段中输入逗号 (,)。 范围 文本分隔符 (文本分隔符)通常保持不变——引号(“)。 下一步点击 OK.
同样,为了快速轻松地将 Excel 转换为 CSV,您可以使用另一个应用程序 - LibreOffice。 同意,如果 Microsoft Excel 能够在创建 CSV 文件时也提供调整设置的功能,那就太好了。
在这篇文章中,我谈到了我所知道的将 Excel 文件转换为 CSV 的方法。 如果您知道从 Excel 导出到 CSV 的更有效方法,请在评论中告诉我们。 感谢您的关注!