isi = ISI export format のためのRubyスクリプトとライブラリ

「isi」はISI社(現トムソン・ロイター)の巨大な学術論文データベース Web of Science のタグのついた出力ファイル(ISI形式) をBibTeX形式やHTMLなどに変換するRubyスクリプトとライブラリのパッケージです. isi2bibtex,isi2html,isi2kakenhi,isi2tohoku の4つのコマンドが同梱されています. 平生LaTeXで学術論文を書いていて,書誌情報をBibTeXで管理している人にはisi2bibtexが便利かもしれません. isi2htmlを使えばHTML版の研究業績リスト を簡単に作成することができます. RubyGemsユーザの方は 「gem install isi」だけで簡単にインストールできます.

ホームページ: http://isi-rb.rubyforge.org/

ダウンロード: http://rubyforge.org/projects/isi-rb/ または http://rubygems.org/gems/isi

目次:

isiのインストール方法と簡単な使い方

Microsoft Windowsの場合

RubyInstaller for Windows でRubyをインストール.同時にRubyGemsもインストールされます. [コントロールパネル]→[システム]→[詳細設定]→[環境変数]などを使って適宜 Pathを通して下さい

・「コマンドプロンプト(cmd)」で次のコマンドを入力してisiをインストール. このとき,ネットワーク セキュリティ ソフトにgemのネットワークへのアクセスの可否を問われることがありますが許可します.

gem install isi

・防火壁の中からプロキシ経由で外部ネットワークにアクセスしている場合は,プロキシとそのポート番号を指定する必要があります.

gem install isi -p http://proxy.example.com:8080

★ 変換したいISI形式のファイルを用意します. ここではsavedrecs.txtとします. なお,Web of Scienceでセーブのときに 「ジャーナル省略形」や「抄録」にもチェックを付けておくとよいでしょう.

・ savedrecs.txtをBibTeX形式のfoo.bibに変換する方法:

isi2bibtex savedrecs.txt > foo.bib

・savedrecs.txtを「論文一括登録ファイル」形式のfoo.xlcに変換したいなら:

isi2tohoku --id 12345678 --name 'Example Name' savedrecs.txt > foo.xlc

なお,

isi2tohoku --help

でこのisi2tohokuの使用方法の詳細を知ることができます.

・savedrecs.txtをHTML形式のfoo.htmlに変換したいなら:

isi2html --help
isi2html --name-regexp='(H\. Yukawa|Hideki Yukawa)' --full-name='Hideki Yukawa' savedrecs.txt > foo.html

とすると,正規表現で指定した名前に下線がひかれたHTMLファイルができます. 適当なpublication.css(パッケージにも同梱)を書いていっしょに使うとよいでしょう.

Mac OS Xの場合

・ Mac OS 10.5.xまたは10.6.xにははじめからRubyとRubyGemsとがインストールされています. 必要なのはisiをインストールすることだけです. [アプリケーション]→[ユーティリティ] から 「ターミナル」を起動して,次のコマンドを実行します. 「gem -v」で表示されるgemのバージョンが1.0.1未満の場合は, Mac OSの「ソフトウエアアップデート」を実行し, OSを再起動してからisiをインストールしてください.

gem -v
sudo gem install isi

・防火壁の中からプロキシ経由で外部ネットワークにアクセスしている場合は,プロキシとそのポート番号を指定する必要があります.

sudo gem install isi -p http://proxy.example.com:8080

あとは上記 Microsoft Windowsの場合 の★印以降と同じです.

UNIXの場合

RubyGems ユーザの方は「gem install isi」だけで簡単にインストールできます.

sudo gem install isi

・防火壁の中からプロキシ経由で外部ネットワークにアクセスしている場合は,プロキシとそのポート番号を指定する必要があります.

sudo gem install isi -p http://proxy.example.com:8080

あとは上記 Microsoft Windowsの場合 の★印以降と同じです.

各コマンドの説明

--help オプションを付けて各コマンドを実行すれば簡単な使い方の説明が表示されます.

isi2bibtex

学術論文や参考文献などの文献情報を個人的に管理する方法としてはEndNoteやBibDesk,BibCompanion,JabRef, はたまたWebベースのCiteULikeやBibSonomyなど専用の文献管理ソフトを使う方法があります. しかし,平生LaTeXで論文を書いているのであれば, 文献情報をBibTeXファイル (bibファイル) で管理するのもよいかもしれません. なぜなら,

などの利点があるからです. isi2bibtex はWeb of Scienceという文献データベースのISI形式をbibファイルに変換するためのRubyスクリプトです.

isi2html

isi2html はISI形式をHTMLファイルに変換します.「研究業績リスト」の作成などにご活用ください. 「Ntc=123」のように被引用数も書き出されます. 出力されたHTMLファイルは適宜編集してください. 適当なpublication.css(パッケージにも同梱)を書いて同じディレクトリに置いておくと見映えがよくなります.

isi2kakenhi

isi2kakenhi はISI形式を科学研究費補助金(科研費)の申請書に記載するためのLaTeX形式に変換します. 正規表現で指定した著者名に下線を付ける機能があります.

isi2tohoku

isi2tohoku はISI形式を 「東北大学研究者紹介 aka 東北大学情報データベース or 全学情報データベース」 の「論文一括登録ファイル」形式に変換します. 「論文一括登録ファイル」形式はExelなどで読み込むことのできるTAB区切りのフォーマットです. isi-1.2.xでは『大学情報データベースシステム一括登録マニュアル(第1.06版)』(学内からアクセス可) で説明されているフォーマットに対応しています. 他大学でも同様の研究者データベースを同じ業者さんが構築していることがあります. スクリプトを少し変更するだけで使うことができるはずです.

isi.rbをライブラリとして使う方法

こんなかんじで使ってください:

#!/usr/bin/env ruby
##
require 'rubygems'   # You may not need this line.
require 'isi'

class ISI_record
  def to_title_author
    "#{@hash['TI']} - #{and_separated_authors}\n"
  end
end

while rec = ARGF.read_an_ISI_record
  print rec.to_title_author
end

love && peace && free_software
Takeshi Nishimatsu
t-nissie {at} imr.tohoku.ac.jp