Новый способ добывания денег - гранты Гордона Мура для учёных, работающих с большими объёмами данных
Писал Сэмуэль Мур в Спектруме 9 января 2014 г.
Новый закон Мура гласит, что обработка больших объёмов данных приведет к большой науке. Фонд Гордона и Бетти Мура планирует раздать в виде грантов полтора миллиона долларов (!!) в размере от 200000$ до 300000$ ежегодно для 15 достойных междисциплинарных учёных, которые могут разработать и использовать новые алгоритмы и методы машинного обучения, а также другие штучки с большими объёмами данных, чтобы превратить эти огромные объёмы
данных в удивительные научные открытия. Согласно фонду, это "вероятно наикрупнейшие частные инвестиции в людей, которые раздвигают границы нового знания по управлению данными, делают науку неотъемлемо многодисциплинарной и объединяющей естественные науки с методами статистики и информатики".
Кажется, фонд Мура думает, что уже накоплено достаточно много данных для того, чтобы сделать большие открытия. Деньги фонда не могут использоваться для приобретения серьёзного оборудования или экспериментов по получению новых наборов данных, а только для того, чтобы проанализировать их новым способом.
Фонд может быть и прав. Большие проекты, такие как Геном человека
и большие приборы, такие как Большой адронный коллайдер уже производят больше данных, чем ученые могут использовать. Один из лучших примеров того, как наука тонет в данных, - генетика, где стоимость секвенирования генома упала так низко и настолько быстро, что анализ доступен бабушке на базаре.
Проблема наводнения данными были уже очевидна более чем десятилетие назад, когда пионер компьютерных сетей Джон Хопфильд сказал IEEE Спектру, что он уже чувствовал, что учёные идут слишком лёгким путём, тупо получая новые данные вместо того, чтобы попытаться проникнуть в суть того, что они уже собрали. Он бросил вызов нейросетевым психам, чтобы выявить внутренние механизмы работы виртуальной мыши с помощью коллекции модельных нейронов, которые он с коллегами стянули вместе, используя только маленький набор данных. Хотя соревнование было выиграно, это вероятно мало для того чтобы уменьшить драйв только от сбора большего количества данных.
Конечно новые и интересные источники научных данных нужны и необходимы. И их достаточно даже без сложных новых инструментов. Так называемая гражданская наука где действуют как экологические, так и геофакторы или медицинские датчики или другое дистанционное научное оборудование продуцируют рост данных год от года. Это уже дало большой результат, такой как радиационные карты Японии после Фукусимы.
Но Мур наверно правильно замыслил потратить некоторые наличные деньги на тех, кто может найти способ заставить эти данные родить даже больше, чем возможно надеялись их собиратели. Наука интенсивных данных только устаканивается. Кроме того, ученые, работающие с данными,
сексуальны согласно "Гарвард бизнес ревью". Таким образом, победители конкурса будут сексуальны и богаты.