エクスポートしたWPのxmlファイルから記事URLだけ取り出す

自分メモ。

経緯:WordPressから記事をエクスポートしたらxml形式だったが、ほしいのはURL一覧だけなのでpythonで抜き出すことにした。他の加工はしない。

xml.etree.ElementTreeを使うのが最も楽そうだったので採用。

pyファイルを作る

#coding: UTF-8
import xml.etree.ElementTree as ET

tree = ET.parse('/path/to/export.xml')
root = tree.getroot()

for link in root.iter('link'):
  print(link.text)

ターミナルから実行する場合

$ python3 yourFile.py

多分さがせばプラグインもあると思うが、複雑なことをしないのでこれで十分。

タイトルとURLをコピーしました