Рассматривается задача построения многомерной полиномиальной регрессии по заданному ее избыточному описанию на основе результатов активного эксперимента. Избыточное описание означает включение в него членов, возможно, отсутствующих в структуре исследуемой регрессии. Таким образом, возникает проблема по результатам активного эксперимента не только оценить значения неизвестных коэффициентов многомерной полиномиальной регрессии, но и исключить из ее избыточного описания лишние члены. Решение поставленной задачи базируется на: (а) получении новых свойств коэффициентов нормированных ортогональных полиномов Форсайта; (б) возможности сведения задачи оценки неизвестных коэффициентов нелинейных членов многомерной полиномиальной регрессии к задаче оценки коэффициентов множества одномерных полиномиальных регрессий и решения соответствующих систем линейных равенств; (в) использовании метода для исключения лишних членов многомерной нелинейной полиномиальной регрессии, который органически включает в себя как методологию кластерного анализа, так и основную идею метода группового учета аргументов -разбиение экспериментальных данных на два множества, одно из которых не используется для оценок неизвестных коэффициентов многомерной полиномиальной регрессии, заданной избыточным описанием.Ключевые слова: многомерная полиномиальная регрессия, нормированные ортогональные полиномы Форсайта, избыточное описание, метод группового учета аргументов, кластерный анализ, линейные равенства О. А. ПАВЛОВ, М. М. ГОЛОВЧЕНКО ПОБУДОВА ОДНОВИМІРНОЇ І БАГАТОВИМІРНОЇ ПОЛІНОМІАЛЬНОЇ РЕГРЕСІЇ ЗА НАДЛИШКОВИМ ОПИСОМ З ВИКОРИСТАННЯМ АКТИВНОГО ЕКСПЕРИМЕНТУРозглядається задача побудови багатовимірної поліноміальної регресії за її заданим надлишковим описом на основі результатів активного експерименту. Надлишковий опис означає включення в нього членів, можливо, відсутніх в структурі досліджуваної регресії. Таким чином, виникає проблема за результатами активного експерименту не тільки оцінити значення невідомих коефіцієнтів багатовимірної поліноміальної регресії, але і виключити з її надлишкового опису зайві члени. Розв'язання поставленої задачі базується на: (а) отриманні нових властивостей коефіцієнтів нормованих ортогональних поліномів Форсайта; (б) можливості зведення задачі оцінки невідомих коефіцієнтів нелінійних членів багатовимірної поліноміальної регресії до задачі оцінки коефіцієнтів множини одновимірних поліноміальних регресій і розв'язання відповідних систем лінійних рівностей; (в) використанні методу для виключення зайвих членів багатовимірної нелінійної поліноміальної регресії, який органічно включає в себе як методологію кластерного аналізу, так і основну ідею методу групового урахування аргументіврозбиття експериментальних даних на дві множини, одна з яких не використовується для оцінок невідомих коефіцієнтів багатовимірної поліноміальної регресії, заданої надлишковим описом.Ключові слова: багатовимірна поліноміальна регресія, нормовані ортогональні поліноми Форсайта, надлишковий опис, метод групового урахування аргументів, кластерний аналіз, лі...
We present the methods for constructing a multivariate polynomial given by a redundant representation based on the results of a limited active experiment. We solve the problem in two formulations. The first is the problem of constructing a multivariate polynomial regression given by a redundant representation based on the results of a limited active experiment. The solution method is based on the previous results of Professor A. A. Pavlov and his students showing the fundamental possibility of reducing this problem to the sequential construction of univariate polynomial regressions and solving the corresponding nondegenerate systems of linear equations. There are two modifications of this method. The second modification is based on proving for an arbitrary limited active experiment the possibility of using only one set of normalized orthogonal polynomials of Forsythe. The second formulation refers to the solution of this problem for a particular but sufficient from the practical point of view case when an unknown implementation of a random variable is not added to the initial measurement results during an active experiment. This method is a modification of the solution method for the multivariate polynomial regression problem. Also, we used the main results of the general theory (which reduces the multivariate polynomial regression problem solving to the sequential construction of univariate polynomial regressions and solution of corresponding nondegenerate systems of linear equations) to consider and strictly substantiate fairly wide from the practical point of view particular cases leading to estimating the coefficients at nonlinear terms of the multivariate polynomial regression as a solution of linear equations with a single variable.
In recent years, the authors in their publications have developed two different approaches to the construction of a multivariate polynomial (in particular, linear) regressions given by a redundant representation. The first approach allowed us to reduce estimation of coefficients for nonlinear terms of a multivariate polynomial regression to construction of a sequence of univariate polynomial regressions and solution of corresponding nondegenerate systems of linear equations. The second approach was implemented using an example of a multivariate linear regression given by a redundant representation and led to the creation of a method the authors called a modified group method of data handling (GMDH), as it is a modification of the well-known heuristic self-organization method of GMDH (the author of GMDH is an Academician of the National Academy of Sciences of Ukraine O. G. Ivakhnenko). The modification takes into account that giving a multivariate linear regression by redundant representation allows for construction of a set of partial representations, one of which has the structure of the desired regression, to use not a multilevel selection algorithm, but an efficient algorithm for splitting the coefficients of the multivariate linear regression into two classes. As in the classic GMDH, the solution is found using a test sequence of data. This method is easily extended to the case of a multivariate polynomial regression since the unknown coefficients appear in the multivariate polynomial regression in a linear way. Each of the two approaches has its advantages and disadvantages. The obvious next step is to combine both approaches into one. This has led to the creation of a synthetic method that implements the advantages of both approaches, partially compensating for their disadvantages. This paper presents the aggregated algorithmic structure of the synthetic method, the theoretical properties of partial cases and, as a result, the justification of its overall efficiency.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.