Browsing all articles in Data Mining
Сен
9

Рецензия на книгу Цисарь И. Ф. "Моделирование экономики в iThink_STELLA"

В книге просто и понятно излагаются основы системно-динамического моделирования в программе iThink. Особенно интересен последний раздел, где рассматриваются конкретные экономические модели. Автор подчёркивает, что искусство моделирования заключается в построении простых моделей, объясняющих исследуемое явление. Если модель становится сложной, то мы перестаём её понимать. В примере по расчёту оптимальной налоговой ставки показывается, что оптимальная налоговая ставка для предприятий — 25%. Также даются примеры моделей для регулирования банковской сферы и анализа инфляции.

Авг
27

Данные для анализа

Author osya    Category Data Mining     Tags

Когда начинаешь потихоньку разбираться в методах Data Mining возникает необходимость в получении различных массивов данных. Желательно, чтобы эти данные в какой-то мере относились к реальной жизни, чтобы их было интереснее анализировать. Проблема в том, что самые интересные данные тщательно охраняются всевозможными NDA, Policy и др. Но ряд источников всё же есть:

  1. Различные данные о финансовых рынках. Например, из «Финам«.
  2. Исходные данные из различных соревнования по Data Mining. Например, http://www.kdnuggets.com/datasets/competitions.html
  3. Проект OpenGovData.Ru
  4. http://pages.cs.wisc.edu/~bsettles/data/
Авг
26

Магазин OZON и системная динамика

Сегодня с утра в 9:45 мне позвонил курьер и привёз книжку И. Ф. Цисарь»Моделирование экономики в iThink_STELLA. Кризисы, налоги, инфляция, банки» . Я не ожидал такой чёткости работы и оперативности от службы доставки магазина OZON. За что им большой респект и уважуха ;)

Сам iThink у меня уже давно стоит и дома, и на работе. Сегодня начну читать. рецензию выложу в LiveLib.

Большое спасибо Байраму за наводку на эту книгу

Авг
25

Курс в INTUIT по Data Mining

Уже третий день штудирую курс «Data Mining» в Интернет Университете Информационных Технологий. Автор курса Чубукова Ирина Александровна.

Недостаток у этого курса типичен для всех курсов INTUIT — они очень нудные. Мне интересно читать книжки, интересно слушать лекции. Но изучать лекции INTUIT — тоска. Есть у них что-то общее. Кстати, средняя оценка курса в целом 4.3. Кроме того, прохождение курсов INTUIT не даёт практики. Получать опыт решения практических задач придётся самостоятельно.

26.08.2009 Уфф! Сегодня удалось сдать экзамен по этому курсу на отлично! Вот диплом Диплом Интернет-Университета Информационных Технологий: Data Mining

Экзамен было сдать достаточно сложно. Я его сдал с третьей попытки. Конечно, после прохождения этого курса экспертом по Data Mining не станешь. Но как очередную ступеньку в постижении Data Mining я могу его рекомендовать.

В качестве учебников к этому курсу на INTUIT предлагается единственная книжка — «Data Mining» от автора курса. Книжку эту я заказал. Она недорогая и для закрепления пройденного материала будет полезно. На OZONе, кстати, этой книжки нет в наличии.

Авг
18

Работа с базами данных в Eclipse

Author osya    Category Data Mining     Tags ,

Работать с базами данных можно напрямую из Eclipse. read more

Авг
18

MDI в Eclipse

По умолчанию файлы в Eclipse открываются в различных вкладках. Можно переключаться между вкладками, кликая на их заголовках. Таким образом в один момент времени на экране отображается содержимое только одного файла. Но часто бывает нужно держать открытыми на экране два и более файлов. read more

Авг
18

Автозагрузка модулей в Windows R GUI

Author osya    Category Data Mining     Tags

Редактор R Gui — это стандартная оболочка R для Winows. Она позволяет выполнять различные команды R и смотреть результаты их выполения. Подключение дополнительных пакетов выполняется с помощью меню Пакеты - Включить пакет. Хотелось бы, чтобы некоторые пакеты (например, Deducer) подключались автоматически пари запуске R GUI. Этого можно достичь, добавление следующей строки в файл C:\Program Files\R\R-2.9.1\etc\Rprofile.site

library(Deducer)

Источник

Авг
17

Text Mining in KNIME

Author osya    Category Data Mining     Tags , , ,

KNIME позволяет делать Text Mining с помощью специального плагина KNIME Text Processing, разрабатываемого в KNIME Labs. Насколько я понял, разработкой этого плагина занимается один человек — Kilian Thiel. Одна из существенных проблем этого плагина — сложность чтения различных распространённых текстовых форматов (Word, PDF, etc).

Но Text Mining можно делать в KNIME и не используя плагин KNIME Text Processing — через R Language или в Weka.

Июл
10

MindMap и системная динамика

На связь между картами памяти (MindMaps) и системно-динамическими моделями меня натолкнул пост

Вам нужен GPS для вашей mind-map? в LifeHacker. В самом деле, SD-модели описывают причинные зависимости между сущностями. Те же причинные зависимости могут быть описаны в виде Mind Maps. Причём существуют уже большие хорошо проработанные Mind Maps. Например, MasterMind Matrix mind map. Одной из самых лучших программ для работы с картами памяти является MindJet MindManager. Пока последняя (8-я) версия этого продукта не предоставляет никаких возможностей для интеграции с продуктами SD-моделирования.