データリポジトリでの研究データ公開② データリポジトリでの研究データ公開の流れ


このページのタグ

電球アイコンこのページでわかること

  1. 自分の研究データが公開できるかどうかを知るには?
  2. 公開先のデータリポジトリはどうやって選べばよいのか?
  3. データリポジトリから研究データを公開する方法

はじめに

データリポジトリでの研究データ公開にあたって、具体的には何をすればよいのでしょうか。このページでは、データリポジトリへに公開するまでの流れについて、必要な準備や、注意すべき点を解説します。

目次

1 研究データの公開可否の確認

まずはそもそも、そのデータを公開してよいのかを確認しましょう。データそのものの内容や、所属機関やコミュニティのポリシーにより、公開が制限されたり、反対に義務付けられていることもあります。具体的にはデータリポジトリでの研究データ公開④データリポジトリでの研究データ公開時の注意点(準備中)をご覧ください。

公開可能である場合でも、その範囲(データのどの部分を、どの粒度で、どこまで)もあわせて確認、検討する必要があります。各種確認には時間がかかることが想定されます。データ公開の可能性が生じた段階で早めに着手することをおすすめします。

では、具体的なポイントを見ていきましょう。

1-1 所属機関やコミュニティのポリシーを確認する

公開したい研究データに関係する出版社(例:論文の投稿先)や研究助成機関(例:科研費であれば日本学術振興会)、所属機関やコミュニティ(例:所属する大学や学会)の規約やポリシーを確認しましょう。研究データの公開義務や公開制限について定められている事柄を確認し、それに沿った対応をしましょう。

原則として公開が義務付けられている例

研究データ公開を推進するため、研究資金の助成機関や出版社、所属機関によってデータ公開が義務付けられている場合があります。

[例] 研究データの原則公開(JST)

研究助成機関によるポリシー(JSTが研究資金を配分し実施する)研究プロジェクトの研究活動計画に責任を負う研究者は、データマネジメントプランに基づき、研究プロジェクトによって生産された研究データを適切に保存・管理するものとする(所属機関又は研究コミュニティが研究データの保存等に関するガイドライン等のルール を定めている場合、そちらも参照のこと)。研究データのうち研究成果論文のエビデンスとなる研究データは原則として公開する。同時にそれ以外の研究データについても公開することを期待する。ただし、研究データの中には公開にあたり特別な配慮を要するものがあることを認識し、公開の対象外とするなど適切な対応を求める。

(国立研究開発法人科学技術振興機構「オープンサイエンス促進に向けた研究成果の取扱いに関するJSTの基本方針ガイドライン(令和5年8月1日改定)」p.3「2. 研究データの取扱い」より)

公開が制限される例

個別の分野や研究コミュニティにおいて、データの公開制限について慣習や基準などがある場合があります。例示のように国際条約として示されている場合もありますが、必ずしも明文化されていないケースもあり、留意が必要です。

[例] 絶滅のおそれのある野生動植物の種の国際取引に関する条約 (CITES)

1-2 関係者に許諾を得る

1-1と並行して、研究データの「関係者」に公開の許諾を得ることも必要となります。まずはどこまでが関係者になりうるのかを十分確認しましょう。共同研究で多くの人や機関がかかわっている場合もあります。一人で判断せず、担当教員等に相談することをおすすめします。

データ公開の許諾は記録に残しておきましょう。許諾が取れた場合はもちろん、取れなかった場合でも、後々のトラブルを避けるためにはそのやり取りを残しておくことが重要です。電子ファイル、プリントアウト両方で保存しておくのがよいでしょう。口頭での了解が無効になるわけではありませんが、後のトラブルを避けるためには、少なくともメモにして残しておくことをおすすめします。

1-3 公開範囲や条件を確認、検討する

公開可能であることが確認できたら、公開可能な「範囲」(データのどの部分を、どの粒度で、どこまで)も確認しましょう。既に1-1、1-2で確認できている(ポリシーや関係者の要望により定まっている)場合もあるでしょう。そのうえで、自分でも検討してみましょう。

このとき、公開にあたっての条件はもれなく確認しておきましょう。例えば、個人情報に匿名化処理を施す場合があります。また、二次利用の条件(ライセンス)指定にあたっては、データの著作権者全員に許可を取る必要があります。

2 公開先のデータリポジトリを決める

研究データの公開可否やその範囲が確認できたら、どのデータリポジトリを利用して公開するのかを決めましょう。検討のためのポイントを説明します。

2-1 各種要件・ポリシー

まずは所属機関や、投稿予定のジャーナル、助成機関が定める要件やポリシーを必ず確認しましょう。使用すべきデータリポジトリが指定されていたり、検討の際にふまえるべき内容が示されていることがあります。

あわせて、自分の研究分野や所属の研究室で一般的に利用されているデータリポジトリがあるかどうか、指導教員や研究室の先輩に確認してみましょう。

2-2 データリポジトリの機能

2-1をふまえて公開先のイメージがつかめたら、候補をしぼりこんでみましょう。具体的には、データリポジトリの信頼性や、研究者が希望する公開要件を満たせるかどうか、といった点を確認し、適切なものを選ぶ作業です。具体的なポイントは以下のチェックリストを参考にしてください。

検討の際は実際にデータリポジトリにアクセスして、利用規約や公開されているデータを見て比較することをおすすめします。実際のデータリポジトリの例は、研究データ公開①データリポジトリについて知るで紹介されています。

データリポジトリの機能、チェックリスト

FAIR原則にのっとった形で運用されているか

「FAIR原則」とは、データの適切な公開方法(Findable / Accessible / Interoperable / Reusable)を表現した国際的な原則です。詳しくは、データリポジトリでの研究データ公開①データリポジトリについて知るで、FAIR原則の項目を参照ください。

FAIR原則を満たしたデータリポジトリであるかどうかは、

 ・ FAIR sharingのサイト
 
・ FAIR原則に準拠したリポジトリ検索サイトDataCite Repository Finder

に掲載されているかが、判断基準の一つとなります。

提供元の信頼性

リポジトリの提供元がデータを公開するにあたって信頼できるか確認しましょう。たとえば、以下のような点をチェックしてみましょう。 

 ・ 安定的にサービスが提供できるような組織によって運営されているか
 ・ セキュリティ、機密性、長期の保存とアクセス(※)は保証されているか
 ・ 公開したデータがどの国のサーバーで保存されるか、また、どの国の法律が適用されるか

万一データの流出や不正利用が起きた場合、どのような対応が必要で、どういった保護が受けられるのか、確認しておくと安心です。各リポジトリのポリシーを参照してみてください。

データリポジトリの信頼性を認証する仕組みとして、CoreTrustSealというものがあります。この認証を受けていれば、FAIR、提供元、DOIの項目は一定の評価がされていると言えます。認証されているデータリポジトリ一覧はこのリストから確認できます。

(※ 論文の実験データの保存期間について、実験ノートなど文書や電子データ、画像などは、論文発表後10年、実験試料や標本などについては5年の保存が原則とされています。これは、各研究資料が、後日の利用・検証に堪えるよう適正な形で一定の期間保存しなければならないためです。詳しくは日本学術会議「回答 科学研究における健全性の向上について」2015年3月6日 p.ⅲ をご覧ください。

DOIが付与されるか

DOIのような永続的識別子(文献を引用する 研究データの引用「識別子」とは?)の付与がジャーナルから求められることがあります。DOIはURLの形にすることができ、そのURLは基本的にリンク切れになることがありません。データの特定やアクセス保証の観点で、非常に有益です。

より詳しくは「データリポジトリでの研究データ公開③ データのライセンス決定・データが発見されやすくする工夫(公開準備中)」も参照ください。

必要なデータ容量が確保されているか

特にデータ容量を多く必要とする場合、公開に上限が無いか、追加料金を求められないかといったことを確認しておく必要があるでしょう。

どのような権利管理、ライセンス付与ができるか

データを利用する第三者に求める条件(例:全く自由に改変してよい、自由に使ってよいが引用元は明記してほしい、等)を考え、その権利表示が公開先のリポジトリで可能か確認しましょう。権利関係やライセンスについて、詳しい説明は「データリポジトリでの研究データ公開③ データのライセンス決定・データが発見されやすくする工夫(公開準備中)」を参照ください。

公開範囲を設定できるか

投稿中の論文で、査読者だけにデータへのアクセスを許可し、論文公開後に全体公開したいといった場合に公開範囲の設定が必要となります。その可否や方法を確認しておきましょう。

取り下げ時の対応

公開後、やむをえずデータを非公開にすることがあるかもしれません。万一に備えて、データリポジトリからデータを取り下げる際にどういった手続きが必要となるのか、事前に確認しておくと安心です。

3 データリポジトリから研究データを公開する

データリポジトリが決まったら、いよいよデータを公開してみましょう。公開にあたっては、データの体裁を整え、データについての説明を作成することが必要となります。

3-1 ファイルフォーマットの確認、変換

データリポジトリによって、公開できるデータ形式が指定されている場合があります。利用規則を確認し、必要に応じて変換をおこないましょう。

[例] Zenodo | About records

形式の指定はありませんが、保存に適した形式でファイルをアップロードする(長期的な保存を念頭に置き、独自のファイル形式は避ける)ようアナウンスしています。

3-2 データについての説明書(Readme)の作成

多くのデータリポジトリでは、データについての説明文書(Readme)をテキストファイルとして作成し、研究データ本体のファイルとともに公開することを推奨しています。必要に応じて作成してみましょう。具体例は「データについての説明文書(Readme;リードミー)の公開」をご覧ください。

3-3 データについて説明するための情報(メタデータ)の作成

研究データの概要(タイトル、作成者名、キーワード、説明文等)を記述した「メタデータ」を適切に作成し、入力することで、データが発見されやすくなります。
多くのデータリポジトリでは、研究データをシステムにアップロードする際に研究者がメタデータを入力するようになっています。

[例] Figshare | Adding or editing metadata

メタデータの各項目に何を入力すればよいか、説明が書かれてあります。

メタデータに入力できる項目は、データリポジトリによって異なります。研究分野によって標準で入力する項目があったり、研究データによって充実させたい項目があるかもしれません。
Digital Curation Centre(DCC), Disciplinary Metadataというデータベースでは、色々なメタデータ入力項目を「社会科学」「物理学」「一般的な研究データ」のように分類して紹介しています。参考にしてみてください。

なお、メタデータ入力項目の一つとして、二次利用の条件(ライセンシング、CCライセンス)があります。これについては、「データリポジトリでの研究データ公開③ データのライセンス決定・データが発見されやすくする工夫(公開準備中)」で詳しく説明します。

3-4 研究データを公開する

ここまでの準備が整ったら、データリポジトリに研究データ(必要に応じてReadmeなどの説明ファイル)を登録、メタデータを入力し、公開しましょう(データリポジトリによりますが、PublishやUploadといったボタンがあります)。実際に公開されているか、データリポジトリ上で確認したり、付与されたDOIで検索してみることをおすすめします。

参考文献

このページのタグ

トップ