Bash on Ubuntu on Windowsをインストールしてみてtar -xfで解凍すると黒画面でアンダーバーからまったく先行きが見えなかったので、tar -xvf(途中経過がわかるよう)で解凍してみた。途中経過はわかったのだけれど、結論からいうと失敗。jsonフォルダとxmlフォルダができて

jsonフォルダには2,528,933個のファイル、xmlフォルダには1,272,121個のファイル。

xmlファイルは途中からopenに失敗していたので仕方ないかな…。解凍に8時間くらいかかった。jsonxmlのフォルダが入っていることがわかった。↓をみるとjsonの件数はこれでよいっぽい。” ~2.6 million in the 2016 file” あとはxmlか…。もう一度しても失敗しそう。ファイルサイズの問題か、それとも時間の関係で途中でPCが止まってしまったのか。xmlはすてて、jsonだけで何かするのも、何かを数えるのには大きすぎそう。jsonデータをMySQLに入れて、SQLで調査したらよいかな…。

orcid.org

 

追記:ファイルサイズが大きすぎた様子。230GBのHDDがいっぱいになっていた。

ORCID

ORCIDの中身がどのようになっているのか調べたくてORCIDのデータを

ダウンロードしたのですが10GBもある。2時間以上かかった。

Windows10のパソコンにダウンロードしたのですが、7Zipとかで解凍しようと

するとオーバヘッドが大きすぎるのか解凍できない…。道のりは遠い…。

figshare.com

 

KBART形式について

データの見方(KBART形式について) | ERDB-JP

なるほど…。Eにしかない項目も多いですねaccess_typeには何が入るのかと

思ったら、無料と有料なのですね。

8)アクセスモデル
以下の二種類のカテゴリーがあります。
・F:Free(無料・オープンアクセス)
・P:Paid(有料)

 NISOをぽちぽちみていると

D2D-commissioned white paper on The Future of Library Resource Discovery

という資料も少し気になる…。

http://www.niso.org/apps/group_public/download.php/14487/future_library_resource_discovery.pdf

CA1784 - 動向レビュー:図書館におけるナレッジベース活用の拡がりとKBARTの役割 / 渡邉英理子, 香川朋子 | カレントアウェアネス・ポータル

世界は進んでいるなぁ…。

GOKb potential supply chain

http://insights.uksg.org/articles/10.1629/uksg.217/figures/Fig04_web.jpg

 

The Global Open Knowledgebase (GOKb): open, linked data supporting li…

このモデルは面白い。規格化されていけば、機械的にやりとりできる仕組み。となるとKBARTの必須項目など気になるところも次々できてきますね。