Pandoc

Pandoc是由John MacFarlane开发的转换工具,用于不同标记语言间的格式转换。Pandoc使用Haskell语言编写,以命令行形式实现与用户的交互,可支持多种操作系统。Pandoc采用GNU GPL授权协议发布。支持几十种格式的转换,如:MarkdownreStructuredTextMediawiki标记语言、HTMLLaTeX、Microsoft Word格式等。

简介

安装

支持的格式

Python中使用

在Python中可以使用pypandoc,它是将Pandoc进行轻量封装,方便在Python语言中使用。

安装好Pandoc后,使用pip安装pypandoc:

pip install pypandoc

接下就可以使用pypandoc进行格式转换了,主要使用两个函数进行转换,convert_file()输入源为文件,convert_text()输入源为字符串,使用如下:

import pypandoc

# 将markdown格式的test.md文件转为rst格式。 
output = pypandoc.convert_file('test.md', 'rst')

# 将test.md文件转为docx格式,并保存到test.docx文件。 返回值为空。
output = pypandoc.convert_file('test.md', 'docx', outputfile="test.docx")

# 通过format参数设置输入的格式。
output = pypandoc.convert_file('test.txt', 'rst', format='md')

# convert_text函数,用于输入字符串转换,通过format参数设置输入的格式。
output = pypandoc.convert_text('# 这是h1标题', 'mediawiki', format='md')

了解更多 >> pypandoc 的 GitHub


资源

官网

相关网站

参考资料