Bash on Ubuntu on Windowsをインストールしてみてtar -xfで解凍すると黒画面でアンダーバーからまったく先行きが見えなかったので、tar -xvf(途中経過がわかるよう)で解凍してみた。途中経過はわかったのだけれど、結論からいうと失敗。jsonフォルダとxmlフォルダができて

jsonフォルダには2,528,933個のファイル、xmlフォルダには1,272,121個のファイル。

xmlファイルは途中からopenに失敗していたので仕方ないかな…。解凍に8時間くらいかかった。jsonxmlのフォルダが入っていることがわかった。↓をみるとjsonの件数はこれでよいっぽい。” ~2.6 million in the 2016 file” あとはxmlか…。もう一度しても失敗しそう。ファイルサイズの問題か、それとも時間の関係で途中でPCが止まってしまったのか。xmlはすてて、jsonだけで何かするのも、何かを数えるのには大きすぎそう。jsonデータをMySQLに入れて、SQLで調査したらよいかな…。

orcid.org

 

追記:ファイルサイズが大きすぎた様子。230GBのHDDがいっぱいになっていた。

ORCID

ORCIDの中身がどのようになっているのか調べたくてORCIDのデータを

ダウンロードしたのですが10GBもある。2時間以上かかった。

Windows10のパソコンにダウンロードしたのですが、7Zipとかで解凍しようと

するとオーバヘッドが大きすぎるのか解凍できない…。道のりは遠い…。

figshare.com

 

KBART形式について

データの見方(KBART形式について) | ERDB-JP

なるほど…。Eにしかない項目も多いですねaccess_typeには何が入るのかと

思ったら、無料と有料なのですね。

8)アクセスモデル
以下の二種類のカテゴリーがあります。
・F:Free(無料・オープンアクセス)
・P:Paid(有料)

 NISOをぽちぽちみていると

D2D-commissioned white paper on The Future of Library Resource Discovery

という資料も少し気になる…。

http://www.niso.org/apps/group_public/download.php/14487/future_library_resource_discovery.pdf

CA1784 - 動向レビュー:図書館におけるナレッジベース活用の拡がりとKBARTの役割 / 渡邉英理子, 香川朋子 | カレントアウェアネス・ポータル

世界は進んでいるなぁ…。

GOKb potential supply chain

http://insights.uksg.org/articles/10.1629/uksg.217/figures/Fig04_web.jpg

 

The Global Open Knowledgebase (GOKb): open, linked data supporting li…

このモデルは面白い。規格化されていけば、機械的にやりとりできる仕組み。となるとKBARTの必須項目など気になるところも次々できてきますね。

GOKb

少しずつでも進めていこうと思います。

 

GOKb…ぐぐるとそのものずばりGoKbのサイトがでてくる。

GOKb: Welcome

最初の説明で

GOKb, the Global Open Knowledgebase, is a community-managed project that aims to describe electronic journals and books, publisher packages, and platforms in a way that will be familiar to librarians who have worked with electronic resources. Following launch in November 2014, libraries and consortia will be working together to extend and maintain the knowledge base.

 

 

と書かれています。

電子ジャーナルや電子ブックならびにパッケージやプラットフォームの情報をコミュニティでオープンなデータベースを作って管理しましょうという感じですね。

ここで気になったのはパッケージを管理しようという発想。電子ジャーナルや電子ブックでは大学や研究機関が買う場合、パッケージ買いが多いため、この部分が必要なのだろう。というか、電子ブックや電子ジャーナルの情報だけであれば従来の目録の概念であまり問題がないように思えるのでKBはここを焦点に作られているように思われます。

ここをどうやって管理しているか次は調べよう。

また、見落とされがちだろうけれど、図書館司書の存在が全面にでていること、こういった管理を世界的に図書館司書が行っているということでしょうね…。電子ジャーナルや電子ブックが個人買いでなく、インフラとして整備される場合、かなり細かい手間がかかっているので、それをみんなの協力で管理できれば一人一人の手間が大きく減るだろうという期待があるのだろうなと思います。その裏にある図書館司書の努力がどう可視化されているかも気になるところです。