Googleスプレッドシートめっちゃ便利。

サイトのページタイトルとかディスクリプションの一覧をスプレッドシートでつくるときに便利な関数があったのでサンプルを紹介します。

=IMPORTXML(【URL】, 【XPath】)

サイトのURLからhtmlの任意の要素を取得し出力します。

【サンプルコード】

=IMPORTXML(【URL】, "//title") 
=IMPORTXML(【URL】, "//meta[@name='keywords']/@content")
=IMPORTXML(【URL】, "//meta[@name='description']/@content")
=IMPORTXML(【URL】, "//div[@class='hoge']") 
上から順に
  • ページタイトルを出力
  • キーワードを出力
  • ディスクリプションを出力
  • 任意のクラスを出力

【URL】の部分はセルを参照したり、任意のURLを入れる。

2つ目の引数にはXPathが入ります。
XPathがわからなければchromeのデベロッパーツールでコピーもできます。

無題クリップ_083116_112142_AM