Автор работы: Пользователь скрыл имя, 26 Марта 2012 в 23:16, курсовая работа
Сучасні умови ведення бізнесу, що характеризуються зростаючою жорсткою конкуренцією і нестабільністю економічних умов, пред'являють підвищені вимоги до оперативності і якості схвалюваних рішень на всіх рівнях управління підприємством або організацією. Підтримка ухвалення рішень передбачає володіння актуальною всеосяжною інформацією про стан і тенденції розвитку бізнесу. При цьому об'єм інформації, яку необхідно враховувати для формування оптимальних обґрунтованих рішень, неухильно росте. Це приводить до ситуації, коли стає неможливо ефективно управляти компанією без використання сучасних засобів інформаційного забезпечення, а саме, методів і засобів бізнес-аналітіки. Бізнес-аналітика - це такі технології, що дають можливість організаціям перетворювати накопичувані дані на інформацію про бізнес, а потім інформацію, - в знання для управління бізнесом.
Вступ..................................................................................................................2
Розділ 1. Аналіз бізнес інформації…………………………………………….5
1.1. Технології аналізу даних……………………………………………………5
1.2. Сховище даних та OLAP……………………………………………………9
1.2.1.Визначення………………………………………………..................10
1.2.2.Схема роботи……………………………………………...................11
1.2.3.Крос-таблиця…………………………………………………………..12
1.2.4.Підготовка даних………………………………………………......................13
1.3. Виявлення знань в базах даних …………………………………………….15
1.4. Добування даних……………………………………………………………..16
1.4.1.Застосування методів data mining……………………………………17
1.4.2.Види моделей…………………………………………………………18
1.4.3. Методи аналізу даних………………………………………………19
Розділ 2. Аналітична система Deductor……………………………………….21
2.1. Прикладні рішення…………………………………………………….........22
2.2. Склад системи…………………………………………………………………23
2.3.Принципи роботи……………………………………………………………..24
Розділ 3. Застосування системи Deductor…………………………………........28
3.1. Особливості ринку нерухомості………………………………………………30
3.2.Задача управління мережею агентств з нерухомості. …………………....31
3.2.1. Система аналітичної звітності …………………………………………..33
3.2.2. Проблема сезонності…………………………………………………......35
3.2.3. Задача прогнозування……………………………………………………36
Висновок………………………………………………………………...................40
Список використаної літератури……………………………………………….42
2
«Урправління мережою агентств з нерухомості»
Вступ
Сучасні умови ведення бізнесу, що характеризуються зростаючою жорсткою конкуренцією і нестабільністю економічних умов, пред'являють підвищені вимоги до оперативності і якості схвалюваних рішень на всіх рівнях управління підприємством або організацією. Підтримка ухвалення рішень передбачає володіння актуальною всеосяжною інформацією про стан і тенденції розвитку бізнесу. При цьому об'єм інформації, яку необхідно враховувати для формування оптимальних обґрунтованих рішень, неухильно росте. Це приводить до ситуації, коли стає неможливо ефективно управляти компанією без використання сучасних засобів інформаційного забезпечення, а саме, методів і засобів бізнес-аналітіки. Бізнес-аналітика - це такі технології, що дають можливість організаціям перетворювати накопичувані дані на інформацію про бізнес, а потім інформацію, - в знання для управління бізнесом.
Інструменти для поглибленої роботи з даними на основі технологій аналітичної обробки даних OLAP (On-line Analytical Processing), здобичі даних (Data Mining) і статистичних пакетів використовують різні організації — промислові, торгові, фінансові, наукові, сфери послуг та інші — для вирішення наступних типових задач.
Фінансові установи аналізують внутрішню звітність банку, бюджет, активи, пасиви і клієнтську базу, контролюють роботу філіалів. Торгові організації досліджують продажу в розрізі номенклатури товарів і торгових марок, аналізують тенденції динаміки продажу товарів за певний період часу. В Важливого значення набуває аналітика відносин з клієнтами і конкурентами, аналітика у сфері персоналу.
Державні організації, накопичуючи в сховищах даних величезні масиви, використовують ці дані для аналізу, наприклад, структури населення країни або регіону в різних розрізах, кадастру земель, паспортів підприємств.
Маркетингові і консалтингові фірми надають звіти про дослідження ринку, виконані за технологією OLAP, своїми клієнтами.
Відповідні інструменти дозволяють також аналізувати інформаційну поведінку відвідувачів сайту компанії, оцінювати інтерес користувачів до різних розділів сайту і продуктів компанії, рекламних матеріалів, тощо.
Вітчизняні та зарубіжні вчені досягли значних результатів у роз’взанні задач аналізу складних систем ,однією з яких є ринок нерухомості, а також у прогнозуванні майбутніх сценаріїв їх розвитку. Зокрема, у роботах В.М Глушкова, М.М. Моісєєва, М.З Згуровского, Ю.П Зайченка, Т.Сааті розроблені моделі та методи ідентифікації та прогнозування процесів у динамічнх системах.
Актуальність теми:
Враховуючи сучасний стан і шляхи розвитку рішень для інтелектуального аналізу даних, можна спрогнозувати декілька тенденцій на майбутнє.
Розширення. Зростає кількість людей, які використовують процеси інтелектуального аналізу даних. І цим однозначно підтверджується факт, що ефективне використання отриманих даних представляє для фірм значну вигоду в процесі конкуренції. Технічні засоби для інтелектуального аналізу даних стають доступнішими. Все вищесказане дає привід сподіватися, що ці рішення поступово упроваджуватимуться не тільки в крупних компаніях, але і в компаніях середнього і малого бізнесу.
Поглиблення. Як правило, технології для інтелектуального аналізу даних в рамках фірми проходять випробування в пробному проекті. У тих компаніях, де рішення вже реалізовані і використовуються, вони поступово розповсюджуються далі на інші області діяльності.
Поява нових напрямів. Після остаточного затвердження інтелектуального аналізу даних в маркетингу, банківській справі, телекомунікаціях, спостерігається поступове проникнення технологій інтелектуального аналізу даних в інші галузі. Варто також пригадати про те, що, наприклад, цей метод можна використовувати в медицині, біохімії, генетиці і багатьох інших сферах діяльності сучасного суспільства.
Розділ 1. Аналіз бізнес інформації
Про аналіз інформації останнім часом говорять так багато й стільки всього, що можна остаточно заплутатися в проблемі. Це добре, що багато звертають увагу на таку актуальну тему. Погано тільки те, що під цим терміном кожний розуміє те, що йому потрібно, часто не маючи загальної картини по проблемі. Фрагментарність у такому підході є причиною нерозуміння того, що відбувається й що робити. Усе полягає зі шматків, слабко зв'язаних між собою й не що мають спільного стрижня. Напев
1.1. Технології аналізу даних
Для того щоб було зрозуміле місце й призначення кожного механізму аналізу, розглянемо задачу в цілому . Будемо відштовхуватися від того, як людина ухвалює рішення, оскільки пояснити, як народжується думка, ми не в змозі, сконцентруємося на тому, як можна в цьому процесі використовуват
Загальна схема роботи приведена нижче
Часто при описі того або іншого продукту, що аналізує бізнес інформацію, застосовують терміни типу ризик-менеджмент, прогнозування, сегментація ринку. Але насправді рішення кожним з цих завдань зводяться до застосування одного з описаних нижче методів аналізу. Наприклад, прогнозування – це завдання регресії, сегментація ринку – це кластеризація, управління ризиками – це комбінація кластеризації і класифікації, можливі і інші методи.
Тому даний набір технологій дозволяє вирішувати більшість бізнес завдань. Фактично, вони є атомарними (базовими) елементами, з яких збирається рішення тієї або іншої задачі. Тепер опишемо окремо кожен фрагмент схеми.
Як первинне джерело даних повинні виступати бази даних систем управління підприємством, офісні документи, Інтернет, тому що необхідно використовувати всі відомості, які можуть стати в нагоді для ухвалення рішення. Причому йдеться не тільки про внутрішню для організації інформацію, але і про зовнішні дані (макроекономічні показники, конкурентне середовище, демографічні дані і т.п.).
Хоча в сховищі даних не реалізуються технології аналізу, воно є тією базою, на якій потрібно будувати аналітичну систему. У відсутність сховища даних на збір і систематизацію необхідної для аналізу інформації йтиме велика частина часу, що в значній мірі зведе нанівець всі переваги аналізу. Адже одним з ключових показників будь-якої аналітичної системи є можливість швидко отримати результат.
Наступним елементом схеми є семантичний шар. Незалежно від того, яким чином аналізуватиметься інформація, необхідно, щоб вона була зрозуміла ЛПР, оскільки в більшості випадків аналізовані даних розташовуються в різних базах даних, а ЛПР не повинен вникати в нюанси роботи з СУБД, то потрібно створити якийсь механізм, що трансформує терміни предметної області у виклики механізмів доступу до БД. Це завдання і виконує семантичний шар. Бажано, щоб він був один для всіх додатків аналізу, таким чином легше застосовувати до завдання різні підходи. Системи звітності призначені для того, щоб дати відповідь на питання "що відбувається". Перший варіант його використання: регулярні звіти використовуються для контролю оперативної ситуації і аналізу відхилень. Наприклад, система щодня готує звіти про залишки продукції на складі, і коли його значення менше середнього тижневого продажу, необхідно реагувати на це підготовкою замовлення на постачання, тобто в більшості випадків це стандартизовані бізнес операції. Найчастіше деякі елементи цього підходу в тому або іншому вигляді реалізовані в компаніях (нехай навіть просто на папері), проте не можна допускати, щоб це був єдиний з доступних підходів до аналізу даних. Другий варіант застосування систем звітності: обробка нерегламентованих запитів. Коли ОПР хоче перевірити яку-небудь думку (гіпотезу), йому необхідно отримати додаткову інформацію,що підтверджує або спростовує ідею, оскільки ці думки приходять спонтанно, і відсутнє точне уявлення про те, якого роду інформацію буде потрібно, необхідний інструмент, що дозволяє швидко і в зручному вигляді цю інформацію отримати. Отримані дані зазвичай представляються або у вигляді таблиць, або у вигляді графіків і діаграм, хоча можливі і інші представлення.
1.2. Сховище даних та OLAP
Хоча для побудови систем звітності можна застосовувати різні підходи, найпоширеніший на сьогодні - це механізм OLAP. Основною ідеєю є подання інформації у вигляді багатомірних кубів, де осі являють собою виміри (наприклад,час, продукти, клієнти), а в комірках містяться показники (наприклад, сума продажів, середня ціна закупівлі). Користувач маніпулює вимірами й одержує і
1.2.1.Визначення
OLAP (англ. online analytical processing, аналітична обробка в реальному часі) — технологія обробки інформації, що включає складання і динамічну публікацію звітів і документів. Використовується аналітиками для швидкої обробки складних запитів до бази даних. Слугує для підготовки бізнес-звітів з продажу, маркетингу, в цілях управління. Причина використання OLAP для обробки запитів — це швидкість. Реляційні БД зберігають суть в окремих таблицях, які зазвичай добре нормалізовані. Ця структура зручна для операційних БД , але складні багато табличні запити в ній виконуються відносно повільно. Заявлений час обробки запитів в OLAP складає близько 0.1 % від аналогічних запитів до реляційної БД.
1.2.2.Схема роботи.
OLAP-структура, створена з робочих даних, називається OLAP-куб. Куб створюється із з'єднання таблиць із застосуванням схеми зірки. У центрі «зірки» знаходиться таблиця фактів, яка містить ключові факти, по яких робляться запити. Множинні таблиці з вимірюваннями приєднані до таблиці фактів. Ці таблиці показують, як можуть аналізуватися агреговані реляційні дані. Кількість можливих агрегацій визначається кількістю способів, якими первинні дані можуть бути ієрархічно відображені.
Алгоритм роботи наступний:
1. Отримання даних у вигляді плоскої таблиці або результату виконання SQL запиту.
2. Кешування даних і перетворення їх до багатовимірного куба.
3. Відображення побудованого куба за допомогою крос-таблиці або діаграм і т.п.
У загальному випадку, до одного куба може бути підключена довільна кількість відображень. Загальну схему роботи настільної OLAP системи можна представити таким чином: Розглянемо як подібна система може бути влаштована всередині. Почнемо ми це з того боку, який можна подивитися, тобто з відображень. Відображення, використовувані в OLAP системах, найчастіше бувають двох видів – крос-таблиці і діаграми. Розглянемо крос-таблицю, яка є основним і найбільш поширеним способом відображення куба.
1.2.3.Крос-таблиця.
На приведеному нижче малюнку, жовтим кольором відображені рядки і стовпці, що містять агреговані результати, світло-сірим кольором відмічені комірки, в які потрапляють факти і темно-сірим комірки, що містять дані розмінностей.
Таким чином, таблицю можна розділити на наступні елементи, з якими ми і працюватимемо надалі:
Заповнюючи матрицю з фактами, ми повинні діяти таким чином: На підставі даних про вимірювання визначити координати елементу, що додається, в матриці. Визначити координати стовпців і рядків підсумків, на які впливає елемент, що додається. Додати елемент в матрицю і відповідні стовпці і рядки підсумків. При цьому потрібно відзначити те, що отримана матриця буде сильно розрідженою, тому її організація у вигляді двовимірного масиву (варіант, лежачий на поверхні) не тільки нераціональна, але, швидше за все, і неможлива у зв'язку з великою розмірністю цієї матриці, для зберігання якої не вистачить ніякого об'єму оперативної пам'яті. Наприклад, якщо наш куб містить інформацію про продажі за один рік, і якщо в нім буде всього 3 вимірювання – Клієнти (250), Продукти (500) і Дата (365), то ми отримаємо матрицю фактів наступних розмірів: К-ть елементів = 250 х 500 х 365 = 45 625 000.
1.2.4.Підготовка даних
Дані, що зберігаються в таблиці необхідно перетворити для їх використання. Так, в цілях підвищення продуктивності при побудові гіперкуба, бажано знаходити унікальні елементи, що зберігаються в стовпцях, що є вимірюваннями куба. Крім того, можна проводити попередню агрегацію фактів для записів, що мають однакові значення розмінностей. Як вже було сказано вище, для нас важливі унікальні значення, наявні в полях вимірювань. Тоді для їх зберігання можна запропонувати наступну структуру:
При використанні такої структури ми значно знижуємо потребу в пам'яті. Що досить актуально, оскільки для збільшення швидкості роботи бажано зберігати дані в оперативній пам'яті. Крім того, зберігати можна тільки масив елементів, а їх значення вивантажувати на диск, оскільки вони нам будуть потрібні тільки при виведенні крос-таблиці.
Завдяки простоті розуміння OLAP набув широкого поширення як механізм аналізу даних, але необхідно розуміти, що його можливості в області глибшого аналізу, наприклад, прогнозування, украй обмежені. Основною проблемою при рішенні, завдань прогнозування є побудова адекватної моделі. Далі все досить просто. На вхід наявної моделі подається нова інформація, пропускається через неї, а результат і є прогноз. Але побудова моделі є абсолютно нетривіальним завданням. Звичайно, можна закласти в систему декілька готових і простих моделей, наприклад, лінійну регресію або щось аналогічне, досить часто саме так і поступають, але це проблему не вирішує. Реальні завдання майже завжди виходять за рамки таких простих моделей. А отже, така модель виявлятиме тільки явні залежності, цінність виявлення яких незначна, або будуватимуть неточні прогнози. Правильним підходом до побудови моделей є їх покрокове поліпшення. Почавши з першої, щодо грубої моделі, необхідно у міру накопичення нових даних і застосування моделі на практиці покращувати її. Власне завдання побудови прогнозів виходять за рамки механізмів систем звітності, тому і не варто чекати в цьому напрямі позитивних результатів при застосуванні OLAP.
Информация о работе Урправління мережою агентств з нерухомості