МОДЕЛЮВАННЯ ПРОЦЕСУ РЕКОНСТРУКЦІЇ ГЕННОЇ РЕГУЛЯТОРНОЇ МЕРЕЖІ НА ОСНОВІ КОМПЛЕКСНОГО ЗАСТОСУВАННЯ ТОПОЛОГІЧНИХ ПАРАМЕТРІВ
DOI:
https://doi.org/10.32782/KNTU2618-0340/2021.4.1.3Ключові слова:
генна регуляторна мережа, топологія мережі, топологічні параметри, функція бажаності Харрінгтона, трешолдінг, алгоритм кореляційного виводуАнотація
У статті представлено результати моделювання щодо визначення оптимальної топології генної регуляторної мережі в процесі її реконструкції із застосуванням кореляційного алгоритму реконструкції мережі. Генна регуляторна мережа представлялася у вигляді неорієнтованого графу, у якому вузли є гени або метаболіти, а дуги визначають зв'язок між відповідними елементами мережі. Оцінка топології мережі здійснювалася шляхом розрахунку значень одиночних топологічних параметрів, які враховують як структуру мережі, так і кількість і характер зв’язків між відповідними елементами. Були досліджені наступні одиночні топологічні параметри: кількість вузлів мережі, ступінь вузлів або їх зв’язність, щільність мережі, коефіцієнти кластеризації та централізації і гетерогенність. Остаточне рішення щодо топології мережі приймалося на основі аналізу узагальненого топологічного параметру, що розраховувався із застосуванням функції бажаності Харрінгтона. Моделювання процесу реконструкції генної мережі на основі профілів експресій генів було проведено у програмному середовищі CytoScape з використанням профілів експресій генів даних moe430 бази даних ArrayExpress, що містять інформацію про експресію генів мезенхімальних клітин двох типів: нервового гребня та мезодерми. Процес реконструкції генної регуляторної мережі здійснювався із застосуванням кореляційного алгоритму, практична реалізація якого передбачає розрахунок коефіцієнтів парної кореляції між профілями експресій генів, що досліджуються. Топологія мережі у даному випадку формується на основі значення трешолдінгового коефіцієнта τ, що визначає порогове значення наявності зв’язку між парою відповідних генів мережі. У результаті моделювання були створені діаграми розподілу одиночних топологічних параметрів і узагальненого топологічного індексу від значення коефіцієнту трешолдінгу. Аналіз отриманих діаграм дозволив визначити оптимальну топологію генної мережі.
Посилання
D‘haeseleer P., Wen X., Fuhrman S., Somogyi R. Linear modeling of mRNA expression levels during CNS development and injury. Pacific Symposium on Biocomputing. 1999. Р. 41–52.
Liang S., Fuhrman S., Somogyi R. REVEAL, a general reverse engineering algorithm for inference of genetic network architectures. Pacific Symposium on Biocomp. 1998. Р. 18–29.
Friedman N., Linial M., Nachman I., Pe'er D. Using Bayesian networks to analyse expression data. Journal of Computational Biology. 2000. №7(3-4). Р. 601–620.
Chen T., He H. L., Church G. M. Modeling gene expression with differential equations. Proceedings of the Pacific Symposium on Biocomputing. 1999. Р. 29–40.
Bansal M., Belcastro V., Ambesi-Impiombato A., di Bernardo D. How to infer gene networks from expression profiles. Molecular Systems Biology. 2007. №3(78). Р.1–10.
Yaghoobi H., Haghipour S., Hamzeiy H., et al. A Review of Modeling Techniques for Genetic Regulatory Networks. Journal of Medical Signals and Sensors. 2012. №2(1). Р.61–70.
Emmert-Streib F., Dehmer M., Haibe-Kains B. Gene regulatory networks and their applications: understanding biological and medical problems in terms of networks. Frontiers in cell and developmental biology. 2014. Р. 1–7.
Soneson C., Delorenzi M. A comparison of methods for differential expression analysis of RNA-seq data. BMC Bioinformatics. 2013. №14(91). Р. 1–18.
Arnone M.I., Davidson E.H. The hardwiring of development: organization and function of genomic regulatory systems. Development. 1997. №124(10). Р. 1851–1864.
Jeong H., Tombor B., Albert R., et al. The large-scale organization of metabolic networks. Nature. 2000. № 407(6804). Р. 651–654.
Bork P., Jensen L.J., von Mering C., et al. Protein interaction networks from yeast to human. Current Opinion in Structural Biology. 2004. №14(3). Р. 292–299.
Babichev S., Taif M. A, Lytvynenko V. Inductive model of data clustering based on the agglomerative hierarchical algorithm. Proceeding of the 2016 IEEE First International Conference on Data Stream Mining and Processing (DSMP). 2016. Р.19–22.
Babichev S., Taif M. A., Lytvynenko V., Korobchynskyi M. Objective clustering inductive technology of gene expression sequences features. Communication in Computer and Information Science. 2017. № 716. Р. 359–372.
Babichev S., Lytvynenko V., Skvor J., Fiser J. Model of the objective clustering inductive technology of gene expression profiles based on SOTA and DBSCAN clustering algorithms. Advances in Intelligent Systems and Computing. 2018. №.689. Р.21–39.
Pontes B., Giráldez R., Aguilar-Ruiz J. S. Biclustering on expression data: A review. Journal of Biomedical Informatics. 2015. № 57. Р. 163–180.
Assenov Y., Ramırez F., Schelhorn S.-E., et al. Computing topological parameters of biological networks. Bioinformatics. 2008. №24(2). Р. 282–284.
Shannon P., Markiel A., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Res. 2003. P. 2498–2504.
Bhattacherjee V., Mukhopadhyay P., et al. Neural crest and mesoderm lineagedependent gene expression in orofacial development. Differentiation, 2007. P. 128–139.