Еркимбаев А.О., Зицерман В.Ю., Кобзев Г.А., Косинов А.В.
Онтологии и моделирование в науке о материалах. Две грани в дисциплинах с интенсивным использованием данных
Ontologies and modeling in materials science. Two facets in data-intensive disciplines
УДК: |
001.8; 004.94; 67.03 |
Аннотация: |
Представлен обзор проводимой в Европе деятельности по организации инфраструктуры, обеспечивающей моделирование материалов. Ее задача - готовность к выполнению заказов промышленности по постановке и реализации исследований. Инфраструктура объединяет информационные и вычислительные ресурсы, обширные наборы физических моделей, многочисленные сервисы, как то: обучение пользователей, разработка стандартов, консультирование специалистов из индустрии и проч. Показано, что ведущую роль в организации подобной инфраструктуры играет система онтологий, гарантирующих согласованное использование понятийного аппарата, фигурирующего во всех моделях, ресурсах и сервисах. Среди множества онтологий наиболее значима EMMO (European Materials Modelling Ontology), которая является онтологией верхнего уровня, способной к расширению, требуемому в связи с использованием различных объектов и видов моделей. Описаны уникальные стандарты, положенные в основу EMMO и других онтологий и покрывающие практически все виды материальных объектов, от субатомных частиц и вплоть до строительных конструкций. Подобный опыт широкомасштабных работ по использованию математического моделирования в материаловедении позволил сформулировать выводы, актуальные для аналогичной деятельности в других предметных областях. |
Ключевые слова: |
информатика материалов, моделирование, онтологии, классификаторы, стандарты, инфраструктура, поток работ, виртуальный рынок |
Abstracts: |
An overview of the activities carried out in Europe to organize the infrastructure that provides modeling of materials is presented. Its task is to be ready to fulfill industry orders for the setting up and implementation of research. The infrastructure combines information and computing resources, extensive sets of physical models, numerous services, such as user training, standards development, consulting industry specialists, and so on. It is shown that the leading role in the organization of such infrastructure is played by a system of ontologies that guarantee the consistent use of the conceptual apparatus that appears in all models, resources and services. Among the many ontologies, the most significant is EMMO (European Materials modeling Ontology), which is a top-level ontology capable of the expansion required in connection with the use of various objects and models. The unique standards that form the basis of EMMO and other ontologies and cover almost all types of material objects, from subatomic particles to structural materials, are described. Similar experience of large-scale activity on the use of mathematical modeling in materials science allowed us to formulate conclusions that are relevant for other subject areas. |
Keywords: |
materials informatics, modeling, ontologies, classifiers, standards, infrastructure, workflow, virtual marketplace |
Авторы статьи:
ЕРКИМБАЕВ Адильбек Омирбекович |
кандидат технических наук, заместитель заведующего лабораторией теплофизических баз данных, Объединенный институт высоких температур РАН |
ЗИЦЕРМАН Владимир Юрьевич vz1941@mail.ru |
кандидат физико-математических наук, ведущий научный сотрудник лаборатории теплофизических баз данных, Объединенный институт высоких температур РАН |
КОБЗЕВ Георгий Анатольевич |
доктор физико-математических наук, профессор, главный научный сотрудник лаборатории теплофизических баз данных, Объединенный институт высоких температур РАН |
КОСИНОВ Андрей Владимирович |
инженер-программист лаборатории теплофизических баз данных, Объединенный институт высоких температур РАН |
Список литературы:
1. |
Когаловский М.Р., Калиниченко Л.А. Концептуальное и онтологическое моделирование в информационных системах //Программирование. 2009. Т. 35. №5. С. 3-25. |
2. |
Еркимбаев А.О., Зицерман В.Ю., Кобзев Г.А. Интенсивное использование цифровых данных в современном естествознании // Научно-техническая информация. Серия 2. 2017. №9. С. 9-22. |
3. |
The Fourth Paradigm. Data-Intensive Scientific Discovery. Ed. by T. Hey, St. Tansley, and Kr. Tolle. 2009. Microsoft Corporation. |
4. |
Н.А.Скворцов, Л.А.Калиниченко, Д.Ю.Ковалев. Концептуальное моделирование предметных областей с интенсивным использованием данных // Труды XVIII Международной конференции DAMDID/RCDL'2016 «Аналитика и управление данными в областях с интенсивным использованием данных». Ершово. 11-14 октября 2016. |
5. |
Кузнецов О.П., Суховеров В.С., Шипилина Л.Б. Онтология как систематизация научных знаний: структура, семантика, задачи // Труды конф. «Технические и программные средства систем управления, контроля и измерения». М. 2010. С. 000762-000773. |
6. |
Bioportal (https://bioportal.bioontology.org/); AberOWL ontology repository and semantic search engine (http://aber-owl.net); Ontology Lookup Service (https://www.ebi.ac.uk/ols/index). |
7. |
Еркимбаев А.О., Зицерман В.Ю., Кобзев Г.А., Косинов А.В. Технологии больших данных в работе с данными по свойствам веществ и материалов // Мониторинг. Наука и технологии. 2018. №2. С. 49-60. |
8. |
Adams N., Cannon E., Murray-Rust P. (2009). ChemAxiom-an ontological framework for chemistry in science. Nature Precedings. 2009. Pp. 1-1. |
9. |
Боргест Н.М. Онтология проектирования. Теоретические основы. Часть 1. Понятия и принципы. Электронное учебное пособие. Самара. 2010. |
10. |
DiGiuseppe N., Pouchard L.C., Noy N.F. SWEET ontology coverage for earth system sciences. Earth Sci Inform. 2014. V. 7. Pp. 249-264. URL: https://doi.org/10.1007/s12145-013-0143-1. |
11. |
Farazi F., Akroyd J., Mosbach S., et al. OntoKin: An Ontology for Chemical Kinetic Reaction Mechanisms. Journal of Chemical Information and Modeling. 2020. V. 60 (1). Pp. 108-120. DOI: 10.1021/acs.jcim.9b00960. |
12. |
Human Disease Ontology ICDO: International Classification of Diseases Ontology URL: https://bioportal.bioontology.org/ontologies/DOID. |
13. |
Materials Modelling is Key to Innovation. URL: https://emmc.info/the-emmc-mission/. |
14. |
Smith B. Classifying Processes: an Essay in Applied Ontology. Ratio. 2012. V. 25(4). Pp. 463-488; see also https://basic-formal-ontology.org/. |
15. |
The European Materials Modelling Ontology (EMMO). URL: https://github.com/emmo-repo/EMMO. |
16. |
Simperler A. Introduction to EMMO. Part II. On-line 29.4.2019. URL: https://emmc.info/wp-content/uploads/2019/04/Part_2_EMMO_Intro.pdf. |
17. |
Varzi A. «Mereology», The Stanford Encyclopedia of Philosophy (Spring 2019 Edition), Edward N. Zalta (ed.), URL: https://plato.stanford.edu/entries/mereology/. |
18. |
CEN Workshop Agreement. European Committee for Standardization. Materials modelling - terminology, classification and metadata. (2017). CWA 17284. URL: https://www.cen.eu/news/workshops/Pages/WS-2017-012.aspx. |
19. |
de Baas, Anne (editor) (2017). What makes a material function? Let me compute the ways Modelling in H2020 LEIT-NMBP Programme Materials and Nanotechnology projects Sixth version, 2017. Directorate-General for Research and Innovation, Industrial Technologies. URL: https://emmc.info/romm6/. |
20. |
Dimiduk D.M., Holm E.A., Niezgoda S.R. Perspectives on the Impact of Machine Learning, Deep Learning, and Artificial Intelligence on Materials, Processes, and Structures Engineering. Integrating Materials and Manufacturing Innovation. 2018. V. 7. Pp. 157-172. |
21. |
Hill J., Mannodi-Kanakkithodi A., Ramprasad R., Meredig B. (2018). Materials Data Infrastructure and Materials Informatics. In: Shin D., Saal J. (eds) Computational Materials System Design. Springer, Cham. https://doi.org/10.1007/978-3-319-68280-8_9. |
22. |
Agrawal A., Choudhary A. Perspective: Materials informatics and big data: Realization of the «fourth paradigm» of science in materials science. APL Materials. 2016. V. 4. Art# 053208. |
23. |
Meredig B. Industrial materials informatics: Analyzing large-scale data to solve applied problems in R&D, manufacturing, and supply chain. Current Opinion in Solid State and Materials Science. 2017. V. 21(3). Pp. 159-166. |
24. |
EMMC Documentation on «Design and Implementation of metadata schema for syntactic and semantic interoperability», Published on 2019. URL: https://emmc.info/emmc-documentation-on-design-and-implementation-of-metadata-schema-for-syntactic-and-semantic-interoperability/. |
25. |
EMMO - Python API for the European Materials & Modelling Ontology. URL: https://github.com/emmo-repo/emmo-python/; примеры использования приведены в разделе emmo-python/demo. |
26. |
Lamy Jean-Baptiste. Owlready: Ontology-oriented programming in Python with automatic classification and high level constructs for biomedical ontologies. Artificial Intelligence In Medicine. 2017. V. 80. Pp. 11-28. |
27. |
Когаловский М.Р. Энциклопедия технологий баз данных. М. Финансы и статистика. 2002. 800 с. |
28. |
Horsch M.T. Semantic Interoperability and Characterization of Data Provenance in Computational Molecular Engineering. Journal of Chemical & Engineering Data. 2020. V. 65(3). Pp. 1313-1329. |
29. |
Maccagnan A. et al. Combining ontologies and workflows to design formal protocols for biological laboratories. Automated Experimentation. 2010. V. 2(3). Pp. 2-14. URL: www.aejournal.net/content/2/1/3. |
30. |
Smirnov P.A. Ontological formalization for workflow-based computational experiments. Procedia Computer Science. 2015. V. 66. Pp. 487-495. |
31. |
Virtual Materials Marketplace. URL: http://vimmp.eu. |
32. |
Horsch M.T., Chiacchiera S., Seaton M.A. et al. Ontologies for the Virtual Materials Marketplace. Kunstl Intell. 2020. Pp. 1-6. URL: https://doi.org/10.1007/s13218-020-00648-9. |
33. |
EMMC Coordination and Support Action. Translators' Guide, version 2 (2018). URL: https://emmc.info/translators-guide-2/. |
34. |
The 2012 ACM Computing Classification System. URL: www.acm.org/publications/class-2012/. |
35. |
PhySH - Physics Subject Headings. URL: https://physh.aps.org/. |
36. |
Hodgson R, Keller P.J. QUDT - Quantities, Units, Dimensions and Data Types in OWL and XML 2011. URL: http://qudt.org/. |
37. |
AllotropeTM Foundation. The Allotrope Framework. URL: https://www.allotrope.org/allotrope-framework. |
38. |
The HDF5® Library & File Format. URL: https://www.hdfgroup.org/solutions/hdf5/. |
39. |
Karagiannis F., Keramida D., Ioannidis Y. et al. Technological and Organizational Aspects of Global Research Data Infrastructures Towards Year 2020. Data Science Journal. 2013. V. 12. GRDI1-GRDI5. |
40. |
C. Thanos. A Vision for Global Research Data Infrastructures. Data Science Journal. 2013. V. 12. Pp. 71-90. |
41. |
Himanen L., Geurts A., Foster A.S., Rinke P. Data-Driven Materials Science: Status, Challenges, and Perspectives. Advanced Science. 2019. V. 6. AR# 1900808. |
42. |
Guarino N., Giaretta P. Ontologies and knowledge bases: towards a terminological clarification. In: Mars, N.J.I. (ed.) Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing. Pp. 25-32. IOS Press, Amsterdam (1995). |
43. |
Когаловский М.Р. Системы доступа к данным, основанные на онтологиях // Программирование. 2012. №4. С. 55-77. |
44. |
Еркимбаев А.О., Зицерман В.Ю., Кобзев Г.А., Косинов А.В. Связывание онтологий с базами данных по свойствам веществ и материалов // Научно-техническая информация. Серия 2. 2015. №12. С. 1-16. |
45. |
Hoehndorf R., Schofield P.N., Gkoutos G.V. The role of ontologies in biological and biomedical research: a functional perspective. Briefings in Bioinformatics. 2015. V. 16(6). Pp. 1069-1080. |
46. |
The Languages, Countries, and Codes (LCC) Specification. URL: https://www.omg.org/spec/LCC/About-LCC/. |
47. |
European Community number. URL: https://en.wikipedia.org/wiki/European_Community_number. |
|
|