Pandoc
Pandoc是由John MacFarlane开发的转换工具,用于不同标记语言间的格式转换。Pandoc使用Haskell语言编写,以命令行形式实现与用户的交互,可支持多种操作系统。Pandoc采用GNU GPL授权协议发布。支持几十种格式的转换,如:Markdown、reStructuredText、Mediawiki标记语言、HTML、LaTeX、Microsoft Word格式等。
简介
安装
支持的格式
Python中使用
在Python中可以使用pypandoc,它是将Pandoc进行轻量封装,方便在Python语言中使用。
安装好Pandoc后,使用pip安装pypandoc:
pip install pypandoc
接下就可以使用pypandoc进行格式转换了,主要使用两个函数进行转换,convert_file()
输入源为文件,convert_text()
输入源为字符串,使用如下:
import pypandoc
# 将markdown格式的test.md文件转为rst格式。
output = pypandoc.convert_file('test.md', 'rst')
# 将test.md文件转为docx格式,并保存到test.docx文件。 返回值为空。
output = pypandoc.convert_file('test.md', 'docx', outputfile="test.docx")
# 通过format参数设置输入的格式。
output = pypandoc.convert_file('test.txt', 'rst', format='md')
# convert_text函数,用于输入字符串转换,通过format参数设置输入的格式。
output = pypandoc.convert_text('# 这是h1标题', 'mediawiki', format='md')
了解更多 >> pypandoc 的 GitHub