このページでわかること
- 研究開始前に想定する研究データ取り扱いの要点
- データマネジメントプランをつくるときに考えておくこと
目次
1. はじめに
研究データ管理を行うためには、研究の開始から終了までの段階において研究データをどう取り扱うか、という方針や方法をあらかじめ文書にまとめておくことが重要です。
このとき作る文書(計画書)を「データマネジメントプラン(Data Management Plan; DMP)」と呼びます。データマネジメントプランは、研究を適切・公正に行うためにも重要ですし、みなさんが競争的研究費を用いるときにも作成を求められます。
なお、研究データと研究データ管理がどういうものかは、「研究データとは」「研究データ管理とデータマネジメントプランとは」 の記事で説明しています。
データマネジメントプラン作成に役立つワークシート
この記事では、研究データ管理を行う上で事前に考えておくポイントとその簡単な説明をまとめました。あわせて、考えておくポイント(問い)をデータマネジメントプランとしても使えるようワークシートにしました。ぜひ書いてみてください。
このワークシートの問いは、国内外の代表的なデータマネジメントプランを参照して作成しました。
そのため、ワークシートは日本の競争的研究費で求められるデータマネジメントプランと全く同じではありません。ですが、ここに示す観点でデータの取り扱いを整理しておくと、競争的研究費において求められるデータマネジメントプランにも対応できます。
競争的研究費において要求される様式は「省庁や競争的研究費の配分機関等における研究データ等の取り扱い方針(リンク集)」の各リンク先で参照してください。
2. 研究データ管理について考えるポイント(ワークシートの解説)
下の図は研究の開始から終了までの流れとそのなかで行う行為を図にしています。
研究データを扱う行為(太字の箇所)は研究のどの段階にも出てきていることがわかります。
このように、研究データは研究の流れのなかで絶えず取り扱う重要なものですので、研究計画書をつくりながら同時に研究データの取り扱いも考えておきましょう。

ワークシートは、上の図にある研究の段階に沿って複数の問いからできています。
問いを考えていくことで、研究の開始から終了後まで一連の研究データの取り扱いを整理することができます。
研究をはじめる前であれば、まだすべて決まっていない、考えられない、と思うことがあるかもしれません。その場合は、推測や見込みの内容で構いませんので、ひととおり考えてみましょう。
そして、研究をはじめた後に、進捗や状況にあわせて更新しましょう。現状にあわせて更新していくことも、とても重要です。
ここからはワークシートに沿って、問いとその解説や考え方のポイントを掲載します。
研究の計画段階
1. その研究からどのような性質や種類のデータが収集・生成されると予想できますか?(例:テキスト文書、インタビュー音声、観測動画、試・史・資料の画像・数値データなど)
データの名称、概要(自分が実施する研究との関連)、おおまかな分類(テキスト、音声、動画等)、方法論(定性的/定量的調査等)を整理します。
研究計画と重なるかもしれませんが、まずはその研究から取得・収集するデータの概況を文字化して確認しましょう。
2. 1人で実施する研究ですか、複数人で行いますか?
複数人で行う研究の場合、そのチームはどのような体制ですか? データを管理するにあたり、自分やチームメンバーはどのような役割を担っていますか?メンバー間で「データの取り扱い」について決まりごとはありますか?
ここでは研究の実施体制と、取得・収集したデータに関与する人やルールを整理しましょう。
1人で行う研究でも、指導教員はその研究にどのように関わるのか、取得・収集したデータは自分だけで管理するのか、などを確認しておきます。
複数人で行う研究(共同研究、研究室全体で実施するチームで研究する場合)では、研究データを誰が管理し、どのように役割を分担するのか、研究データの取り扱いにどのようなルールがあるのかを確認します。
たとえば、1つの研究プロジェクトを研究室に所属するメンバーが分担している場合、教員が研究の実施も研究データ管理も総括している、ということが考えられます。また、大型の研究プロジェクトであれば、個人ではなく機関やプロジェクト内のグループが役割を分担することもあります。
3. その研究では、研究助成を受けていたり、研究契約等を結んだりしていますか?
している場合、研究データに関する事前の取り決めや、取り扱い要件がないかを確認していますか?
研究助成の要項や研究契約書を確認しましょう。
成果発表(論文や特許等)に関する取り決めはあっても、データに関しては言及されていないこともあります。取り決めがない場合、どのような取り扱いがよいのか考えましょう。考えるときは1人で決めず、研究室のメンバーや指導教員にも相談しましょう。
4. 研究分野や学会ごとに定められた、データの標準形、取り扱い方法、構造化等に関するガイドラインはありますか?
研究分野によっては、学会においてデータ標準やガイドライン等が定められていることがあります。そのほか、研究室で取り扱いルールがないかなども確認しましょう。
5. 研究の過程で収集・生成するデータに、個人情報や、秘匿すべき情報が含まれていますか?
取り扱うデータはとくに配慮が必要ないのか、それとも特別な措置や留意が必要なものなのかを事前に確認しておくことは重要です。
個人情報や秘匿すべき情報が含まれている場合、まずは大学の個人情報保護や情報管理の規程を読みましょう。研究分野によっては、その研究や取り扱うデータが安全保障や輸出管理の対象となることがあるので、関連情報を一読することをお薦めします。また、研究分野のガイドライン、学内の関連する定めや研究室内の取り扱いなども確認しましょう。
6. 研究中のデータの保管場所をどこにするか決めていますか?
データの保管場所や、バックアップ方法、そのデータに誰がアクセスできるのか(取り扱いに特別な措置が必要な場合はどう制限するのか)をあらかじめ想定しておきましょう。
研究の遂行段階
7. 研究プロセスのどの段階で、どのような方法によって研究データを収集・生成しますか?
その際、どのような機器やツールを使用する予定ですか?
データを収集・生成する時期はいつでしょうか。何を使うか、どう収集するか(使うツール・機器・ソフトウェア、地理的情報等)をあらかじめ考えましょう。たとえば、文献収集後、○○の時期からフィールドワークに出かけてインタビューを行い、音声・画像データを収集する、のように概要を整理しておきます。
8. 収集・生成されるデータは、どのようなフォーマットで、どれくらいの量になると予想していますか?
大まかでよいので、どの程度のデータになりますか。フォーマット、データ量(ファイル数は数十、数百、数千なのか、サイズはGB単位、TB単位、PB単位なのか)を想定しましょう。
これは、データの保管とバックアップの容量・環境などを準備するのに非常に重要です。
9. データの収集・生成や分析において、どのようなツールや機器を使う予定ですか?
研究を実施する方法(分析手法、機器やソフトウェアなど)を想定して記録しましょう。
10. 収集・生成したデータは、観測機器や分析ツール等に依存した特殊なデータ形式ですか?
使用した機器や分析ツールに依存したデータフォーマットになる場合は、何を使ってどのようなフォーマットになるのか、取り扱いに留意が必要なのかなどを記録しましょう。
自分や第三者が後からそのデータを見たり使ったりするとき、必要な情報です。
11. データを分析するため、または研究を行うのに必要な質を保つために、どのような作業をしますか?
研究データを取得・収集したそのまま分析するのではなく、分析の前になんらかの整理や前処理を行ったり、質の確保のためにチェック作業や手順・方法を検討したりすると思います。このような作業も整理して記録しておくことが重要です。
どのような作業をするのかは、研究の進捗によって変わるかもしれません。研究を始める前には、全体の整理のために考えられる作業や方法の概要をまとめておき、研究の進捗によって更新しましょう。
分析前のデータの整理などについては、「データクリーニング入門(初心者向け)」も参考にしてください。
研究のまとめ・終了段階
12. その研究データをどこかに公開したり、だれかと共有する予定はありますか?
公開する場合は、いつ、どこに、どのような形で公開しますか?
研究データを公開するかどうか(可否)、公開する場合いつ(時期)、どの程度公開するのか(範囲)は、原則として研究者自身が決定します。
ただし、競争的研究費の配分機関やジャーナルのポリシーによっては、データ公開・共有・非公開に関する方針があったり、公開場所が推奨されていたりすることもあります。その際は、どの範囲のデータをどこに公開するのかも想定し、あわせて公開前の準備作業も確認しておきましょう。
データ公開については、「研究成果をオープンアクセスにする」 「データリポジトリについて知る」「データリポジトリでの研究データ公開の流れ」 の記事も参考にしてください。
13. 研究終了後、データをどこに保管しますか?
保管が必要な期間と、 誰が管理責任者となるかを決めていますか?
論文等の成果公開後、10年間は保管の義務があります。適切に保管でき、後から自分や第三者がそのデータを確認できるように、保管場所や期間、管理者を決めておきましょう。
また、研究室のなかには、大学を離れるときに指導教員にデータの提出を義務付けていることもあります。研究室のルールも確認しましょう。
まとめ
それぞれの問いは考えられたでしょうか。
ひとことで「研究データの一連の取り扱い」と言っても研究分野の慣習から研究室のルール、ご自身で決めることまで多岐にわたる内容が含まれます。
研究の開始前に全てを考えるのは難しい、と感じるかもしれませんが、研究計画とともに、研究データ管理まで考えておくことはとても大切です。また、研究がはじまったら、状況や進捗にあわせて更新しましょう。
ここに挙げたポイントを考えることで、研究データを取り扱うための準備や、論文投稿時のデータ公開に備えることができます。
この記事は、イリノイ大学 "Data Management Planning Workbook (Caldrone, Sandi)"を参考に作成しました。


