ВНИМАНИЕ: Путешествуй по научной литературе



International Science Grid This Week, 28 мая 2008.




Исследователи, заинтересованные в повышении производительности труда и более эффективном междисциплинарном сотрудничестве, могут завести у себя новое инструментальное средство.

Катерина Блейк (Catherine Blake), профессор-ассистент из
,Университета Северной Каролины, , сотрудник Школы по информатике и библиотечной науке разработала метод поиска, анализа и фиксирования родственных связей в опубликованных научных текстах самых различных научных дисциплин. "В научной литературе как у себя дома" имя этого метода. Он позволяет исследователям в некоторой области собирать представляющую интерес опубликованную информацию из других областей знания.


Профессор Блейк и сотрудники ее группы проанализировали 162 000 документов из самых различных областей науки с помощью метода, который они называют методом грамматического разбора на основе подчиненности (dependency parsing ). На основе этого метода производится анализ грамматической структуры предложений с целью обнаружения осмысленных зависимостей среди слов в различных документах.

"Получение этих результатов на высокопроизводительном настольном компьютере потребовало бы около 15000 часов, или семь с половиной лет при 40-часовой рабочей неделе", говорит профессор Блейк.

RENCI (Renaissance Computing Institute) , Вычислительный институт возрождения, совместный проект нескольких университетов Северной Каролины и администрации штата, предоставил Блейк техническое обеспечение, сайтовые ресурсы и подключение к национальной сети компьютерных ресурсов , Open Science Grid, а В RENCI была создана специальная программа, спонсированная университетом Северной Каролины (UNC Chapel Hil)

С помощью ресурсов Открытого научного грида (Open Science Grid) Блейк вместе со своей командой программистов умеет очень быстро производить структурный анализ предложений. За 28 часов она обрабатывает несколько миллионов предложений.

"Для грида это идеальный проект, так как задание уже состоит из маленьких фрагментов, которые могут выполняться на компьютерах где угодно", говорит Блейк. "Сокращение времени обработки позволило нам заняться решением вопросов, представляющихся в противном случает из-за своей сложности неразрешимыми."

Блейк и RENCI работают в настоящее время над преобразованием этой программы текстовой обработки в службу, полезную занимающимся обработкой естественных языков.

"Предоставление ученым быстрого и удобного доступа к таким дорогим вычислительным средствам, как эти, было бы чрезвычайно полезно," говорит Блейк.
Catherine Blake