NoSQLに関して
2023.09.23
・まずNoSQLについて簡単に説明しておく。これはデータベース言語のひとつである。SQLという言葉は聞いたことがあるのではないか。これはデータを表形式で管理するための言語であり、われわれもソフト開発でお世話になっている。NoSQLのNoはSQLの否定ではなく、Notonlyの略だと言われている。つまりSQL言語の拡大版がNoSQLだ。有名なのはグーグルのBigTableだが、それ以外にも多数あり、オープンソースとしてはMongoDBなどが有名だ。
・なぜ一般の人にあまりなじみがないデータベース言語の話でこのブログを始めたかというと、ちょっと気になる話を聞いたからだ。ある大学のデータ関連学部では、学生にR言語を習得させているという。
・R言語は統計分析用言語である。ということは、この学校ではデータ=数値データと解釈し、それの分析用具としてR言語を学生に学ばせているという印象を持った。これ自体は一つの考え方だが、ちょっと最近の一般動向とは異なる。
・そこで最初のNoSQLに戻るのだが、これは単純に言うと、画像、文章、地図情報などあらゆる雑多な情報を扱うためのデータベースだ。グーグルの検索エンジンでは(他の検索エンジンでも同じだが)、単に数字だけではなくあらゆる雑多な情報が検索できなければならない。それを扱うデータベース言語がNoSQLだといっても差し支えないだろう。
・だとすると、数値データの厳密な分析を学ぶのも重要だが、そもそも扱うデータそのものが視覚情報から文字情報に至るまであらゆるものに広がった時、どう対処するかという問題が残る。今はやりのChatGPTはこうしたデータを難なく扱うことができる。とすると件の学校で学ぶ学生の勉強分野はちょっと狭い感じがする。
・もしもわれわれが若者にIT教育をするなら、ラスベリーパイ(Raspberry Pi)を買い与え、勝手に遊ばせるだろう。これは英国で開発された教育用コンピュータで日本でも1万円程度で買うことができる(アマゾンなど)。
・これにキーボード、マウス、マイクロSDカード、ディスプレイ、電源などを用意すれば、自前のコンピュータシステムが出来上がる。この上でパイソンを走らせて、勉強すればよい。そのうえで、興味があればデータ分析に向かうことになる。
・もちろんこのやり方の歩留まりはあまり高くない。学生が10人いれば、これを面白いと思う学生は1-2人かもしれない。それはたとえば音楽教育などと同じことだ。才能と興味のある学生は限られるからだ。腕の良い学生をラスベリーパイで遊ばせてやれば、あっという間に腕の良いプログラマーが育つ。要はITユーザーを育てるか、それともデータ分析を含めたIT開発の担い手を育てるかという問題だ。
・だいぶ前のことだが、筆者がある会合で講演し、その時に話のはずみで「大学ではまだフォートランを教えているところもあるようです」としゃべったら、講演後大学の先生が寄ってきて、「うちの大学ではそうなんです」と言われた時には、申し訳ない思いをした。
・日本はタダでさえ、IT革新に乗り遅れている。IT革新を担える人材を育てるためには、型にはめずに、なるべく最先端技術を自由気ままに触れるようにした方がよいと思うが、どうだろうか。