如何让 ChatGPT 翻译网页内容,并尽可能保留格式

前面在《一个简单的 Prompt 大幅提升 ChatGPT 翻译质量,告别“机翻感”》中介绍过如何提升翻译质量,这对于文本内容来说已经效果很好了。

但有时候我们要翻译的内容可能包含链接、图片,虽然我们可以先翻译纯文本,再通过编辑功能加上链接和图片,但还是有点麻烦。那么有没有好办法让 ChatGPT 直接翻译带有链接和图片的网页内容呢?

理论上来说 ChatGPT 直接翻译 HTML 也是可以的,但是有几个问题:

  1. HTML 格式冗余信息太多,很容易超出长度
  2. 由于 HTML 对文本结构的破坏,可能会影响翻译结果,导致翻译结果不连贯

最好的做法是使用 Markdown 格式,这样既可以保留文本结构,又可以去掉冗余信息。

所以我通常会先将网页内容转换成 Markdown 格式,然后手工调整一下,把不必要的信息去掉,再手动分页输入到 ChatGPT 中。