自分メモ。
経緯:WordPressから記事をエクスポートしたらxml形式だったが、ほしいのはURL一覧だけなのでpythonで抜き出すことにした。他の加工はしない。
xml.etree.ElementTreeを使うのが最も楽そうだったので採用。
pyファイルを作る
#coding: UTF-8
import xml.etree.ElementTree as ET
tree = ET.parse('/path/to/export.xml')
root = tree.getroot()
for link in root.iter('link'):
print(link.text)
ターミナルから実行する場合
$ python3 yourFile.py
多分さがせばプラグインもあると思うが、複雑なことをしないのでこれで十分。