ФОРМИРОВАНИЕ МЕТАДАННЫХ МНОГОМЕРНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ НА БАЗЕ КЛАССИФИКАЦИОННЫХ СХЕМ
Фомин Максим Борисович , Кузнецов Евгений Александрович , Шорохов Сергей Геннадьевич
2018 / Том 22, №12 (143) 2018 [ ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ ]
Разработан способ формирования метаданных многомерной информационной системы путем сопряжения классификационных схем. Каждая классификационная схема представляет собой иерархию значений измерений, относящихся к отдельной структурной компоненте наблюдаемого явления. В основе метода лежит выявление групп значений измерений, которые связаны с группами значений других измерений. Группы значений разных измерений используются для построения кластеров сочетаний значений измерений. Сочетания кластера формируются декартовым произведением групп значений измерений. Метаданные информационной системы представлены в виде множества допустимых сочетаний значений измерений, которые формируются как набор кластеров. Для решения этой сложной задачи наблюдаемое явление рассматривается как набор структурных компонент. Из полного набора измерений информационной системы выделяются отдельные наборы измерений, семантически связанные со структурными компонентами наблюдаемого явления. Семантические связи, выявленные в процессе анализа структурной компоненты, позволяют построить иерархию групп значений измерений и представить их совокупность в виде графа - классификационной схемы, связанной со структурной компонентой. В информационных системах с многоаспектным описанием предметной области кубы данных характеризуются большой разреженностью, что затрудняет формирование метаданных. Классификационные схемы описывают отдельные аспекты метаданных, связанные с отдельными структурными компонентами наблюдаемого явления. Сопряжение классификационных схем дает возможность получить полное описание метаданных. Использование классификационных схем позволяет разбить задачу описания структуры аналитического пространства многомерной информационной системы на более простые задачи анализа его отдельных структурных компонент. Сопряжение классификационных схем, относящихся к разным структурным компонентам, дает возможность сформировать метаданные информационной системы. В метаданных центральное место занимает множество допустимых сочетаний значений измерений.
Ключевые слова:
multidimensional information system,multidimensional data cube,sparse data cube,classification scheme,combination of measurement values,set of possible member combinations
Библиографический список:
- Thomsen E. OLAP Solution: Building Multidimensional Information System. NY, Willey Computer Publishing. 2002. 688 p.
- Висков А.В., Фомин М.Б. Методы описания допустимых сочетаний реквизитов-признаков при использовании многомерных моделей в инфокоммуникационных системах // T-Comm. Телекоммуникации и Транспорт. 2012. № 7. С. 45-47.
- Hirata, C.M., Lima, J.C. Multidimensional cyclic graph approach: representing a data cube without common sub-graphs. Information Sciences. 2011. Vol. 181. P. 2626-2655. DOI: 10.1016/j.ins.2010.05.012
- Luo Z.W., Ling T.W., Ang C.H., Lee S.Y., Cui B. Range top/bottom k queries in OLAP sparse data cubes. In: Mayr H.C., Lazansky J., Quirchmayr G., Vogel P. Database and Expert Systems Applications - DEXA 2001. Vol. 2113. P. 678-687. Heidelberg, Springer, 2001. P. 678-687. DOI: 10.1007/3-540-44759-8_66
- Vitter J.S., Wang M. Approximate computation of multidimensional aggregates of sparse data using wavelets. In: Proceedings of the 1999 International Conference on Management of Data - SIGMOD 1999. New York, ACM. 1999. P. 193-204. DOI:10.1145/304182.304199
- Messaoud R.B., Boussaid O., Rabaseda S.L. A multiple correspondence analysis to organize data cube. In: Databases and Information Systems IV - DB&IS 2006. Vilnius, IOS Press. 2007. P. 133-146.
- Karayannidis N., Sellis T., Kouvara Y. CUBE file: a file structure for hierarchically clustered OLAP cube. In: Bertino E., Christodoulakis S., Plexousakis D., Christophides V., Koubarakis M., BЕohm K., Ferrari E. Advances in Database Technology - EDBT 2004, vol. 2992. Heidelberg, Springer. 2004. P. 621-638. DOI: 10.1007/978-3-540-24741-8_36
- Chen C., Feng J., Xing L. Computation of sparse data cubes with constraints. In: Kambayashi Y., Mohania M., Wob W. Data Warehousing and Knowledge Discovery - DaWaK 2003. Vol. 2737. Heidelberg, Springer. 2003. P. 14-23. DOI: 10.1007/978-3-540-45228-7_3
- Wang W., Lu H., Feng J., Yu J.X. Condensed cube: an effective approach to reducing data cube size. In: Proceedings of the 18th International Conference on Data Engineering - ICDE 2002. IEEE Computer Society, Washington. 2002. P. 155-165.
- Gomez L.I., Gomez S.A., Vaisman A.A. generic data model and query language for spatiotemporal OLAP cube analysis. In: Rundensteiner, E., Markl, V., Manolescu, I., Amer-Yahia S., Naumann F., Ari I. Proceedings of the 15-th International Conference on Extending Database Technology - EDBT 2012. New York, ACM. 2012. P. 300-311.
- Фомин М.Б. Описание метаданных многомерных информационных систем с использованием кластерного метода // Вестник Иркутского государственного технического университета. 2017. Т 21. № 7. С. 78-86. https: doi.org/10.21285/1814-3520-2017-7-78-86.
- Salmam F.Z., Fakir M., Errattahi R. Prediction in OLAP data cubes. Journal of Information & Knowledge Management. 2016. Vol. 15. No. 2. P. 449-458. DOI: 10.1142/S0219649216500222
- Fu L.: Efficient evaluation of sparse data cubes. In: Li Q., Wang G., Feng L. Advances in Web-Age Information Management, vol. 3129 - WAIM 2004. Heidelberg, Springer, 2004. P. 336-345. DOI: 10.1007/978-3-540-27772-9_34
- Romero O., Pedersen T.B., Berlanga R., Nebot V., Aramburu M.J., Simitsis A.: Using semantic web technologies for exploratory OLAP: A survey. IEEE Transactions on Knowledge and Data Engineering. 2015. Vol. 27. No. 2. P. 571-588. DOI: 10.1109/TKDE.2014.2330822
- Salmam F.Z., Fakir M., Errattahi R. Explanation in OLAP data cubes. Journal of Information Technology Research. 2014. Vol. 7. No. 4. P. 36-78. DOI: 10.4018/jitr.2014100105
- Orlov Y., Gaidamaka Y., Zaripova E. Approach to estimation of performance measures for SIP server model with batch arrivals. In: Vishnevsky V., Kozyrev D. Distributed Computer and Communication Networks. DCCN 2015, vol 601. Cham, Springer, pp. 141-150. DOI: 10.1007/978-3-319-30843-2_15
- Висков А.В., Фомин М.Б. Моделирование аналитических измерений в многомерных базах данных // Вестник Иркутского государственного технического университета. 2012. Т. 63. № 4. С. 15-19.
Файлы: