▍本文重點:一分鐘匯出你的 WordPress 文章,將 XML 轉成乾淨的文字檔案(.md 或 .txt)
如果你想讓 ChatGPT 或者任何 AI 工具能幫你寫作、創作,怎麼提供你過往的內容案例,讓它能有依據地學習你的文字風格是最重要,也是最麻煩的一步。
例如我所創作的大量文字內容都在 WordPress(這裡)上,但 WordPress 後台只能讓我們匯出 XML 檔案:
但如果你要訓練 ChatGPT GPTs,一大包的 XML 很難用。有沒有辦法把你單篇文章轉成更乾淨的 markdown1 呢?
搜尋了一下,還真的讓我找到了 palaniraja / blog2md 這個 Github 專案,感謝這作者寫了這程式,我這篇就不廢話,快速步驟式的方式,讓你理解怎麼把你的 WordPress 文章匯出成一篇一個 Markdown 文檔,方便你後續運用,無論是給 AI 訓練、出版或其它用途都更方便。
將 WordPress 文章匯出步驟
- WordPress 後台 > 工具 > 匯出程式
- 選擇文章,你可以在透過分類、作者、發佈日期、狀態來進行篩選
- 你會得到一個 .xml 的檔案,如上圖
將 XML 檔案裡的文章包,轉成單篇的 Markdown 文字檔
- 點此下載 blog2md 壓縮檔(你也可以自行到原 Github 專案頁面下載),並解壓縮
- 開啟終端機(Terminal APP),將終端機的當前目錄移動(cd)至你解壓縮的資料夾,若你沒去改名稱為:blog2md-master。
- 例如我是放在「下載項目」資料夾下,所以輸入:
cd ~/Downloads/blog2md-master
(可參考下圖) - 輸入指令
npm install
安裝所需的依賴包。 - 輸入指令運行專案,參考下列2:
- 請記得把剛匯出的 xml 檔案,改名為「wordpress-backup-export.xml」,並放在同一個資料夾下
WordPress 備份轉換命令
node index.js w wordpress-backup-export.xml out
Blogger 備份轉換命令
node index.js b your-blogger-backup-export.xml out
恭喜你成功!🥳 這樣你就有完整、乾淨的文字檔案,可以做其它運用了。
如果是要建立 ChatGPT GPTs,還是建議再把副檔名改成 .txt,因為我用 .md 的經驗常常會變成幻覺,這邊也提供兩篇我的過往 ChatGPT 文章,如果你有需要可以進一步閱讀: