CORAL
CORAL3.0についてtanabeさんからたくさん教えていただいて、インストールした。
Usage Statistics機能をみていきたいと思っています。
■
ORCID展開してみたけれど有用なデータが引き出せないので一旦仕切り直し
■
Bash on Ubuntu on Windowsをインストールしてみてtar -xfで解凍すると黒画面でアンダーバーからまったく先行きが見えなかったので、tar -xvf(途中経過がわかるよう)で解凍してみた。途中経過はわかったのだけれど、結論からいうと失敗。jsonフォルダとxmlフォルダができて
jsonフォルダには2,528,933個のファイル、xmlフォルダには1,272,121個のファイル。
xmlファイルは途中からopenに失敗していたので仕方ないかな…。解凍に8時間くらいかかった。jsonとxmlのフォルダが入っていることがわかった。↓をみるとjsonの件数はこれでよいっぽい。” ~2.6 million in the 2016 file” あとはxmlか…。もう一度しても失敗しそう。ファイルサイズの問題か、それとも時間の関係で途中でPCが止まってしまったのか。xmlはすてて、jsonだけで何かするのも、何かを数えるのには大きすぎそう。jsonデータをMySQLに入れて、SQLで調査したらよいかな…。
追記:ファイルサイズが大きすぎた様子。230GBのHDDがいっぱいになっていた。
ORCID
ORCIDの中身がどのようになっているのか調べたくてORCIDのデータを
ダウンロードしたのですが10GBもある。2時間以上かかった。
Windows10のパソコンにダウンロードしたのですが、7Zipとかで解凍しようと
するとオーバヘッドが大きすぎるのか解凍できない…。道のりは遠い…。
KBARTのデータ交換
KBARTはダウンロード、アップロードが主なのかな。
KBART形式について
なるほど…。Eにしかない項目も多いですねaccess_typeには何が入るのかと
思ったら、無料と有料なのですね。
8)アクセスモデル
以下の二種類のカテゴリーがあります。
・F:Free(無料・オープンアクセス)
・P:Paid(有料)
NISOをぽちぽちみていると
D2D-commissioned white paper on The Future of Library Resource Discovery
という資料も少し気になる…。
http://www.niso.org/apps/group_public/download.php/14487/future_library_resource_discovery.pdf
CA1784 - 動向レビュー:図書館におけるナレッジベース活用の拡がりとKBARTの役割 / 渡邉英理子, 香川朋子 | カレントアウェアネス・ポータル
世界は進んでいるなぁ…。
GOKb potential supply chain
The Global Open Knowledgebase (GOKb): open, linked data supporting li…
このモデルは面白い。規格化されていけば、機械的にやりとりできる仕組み。となるとKBARTの必須項目など気になるところも次々できてきますね。