Разработка программно-технологического обеспечения статистического описания объектов

Тип:
Добавлен:

ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ, СИМВОЛОВ, ЕДИНИЦ, СОКРАЩЕНИЙ И ТЕРМИНОВ

ПО - программное обеспечение

ПП - программный продукт

ГОСТ - государственный стандарт

ТУ - технические условия

ANCOVA- анализ ковариаций

МНК - одношаговый метод наименьших квадратов

ИШ - источник шума

РТ - расчетная точка

СОДЕРЖАНИЕ

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1. описание математических методов обработки эмпирических данных: ancova и регрессионный метод

1.1 Дисперсионный анализ

.2 Регрессионный метод и анализ ковариаций ANCOVA

. ОРГАНИЗАЦИЯ среды программирования на android

.1 Организация операционной системы

2.2 Программная реализация метода 1МНК в среде С++ под Android

. ПРИЛОЖЕНИЯ РАЗРАБОТАННОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ К ОБРАБОТКЕ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

3.1 Некоторые дополнительные теоретические сведения

.2 Измерения физических параметров

. ЭКОЛОГИЧНОСТЬ И БЕЗОПАСНОСТЬ ПРОЕКТА

.1 Анализ условий труда разработчика

. ОРГАНИЗАЦИОННО-ЭКОНОМИЧЕСКАЯ ЧАСТЬ ПРОЕКТА

.1 Организация разработки программного продукта

.2 Расчет и оптимизация параметров сетевого графика

ЗАКЛЮЧЕНИЕ

Список использованных источников

ПРИЛОЖЕНИЕ А

ВВЕДЕНИЕ

Развитие средств вычислительной техники в значительной мере влияет на сферы деятельности человека. Одновременно, возможности, которые предоставляются в связи с прогрессом в этой области, постоянно расширяются, расширяется круг задач, которые могут быть решены и которые раньше требовали значительных ресурсных усилий, если вообще были разрешимы. Это опосредованно приводит к необходимости совершенствования существующего программного обеспечения и разработки новых приложений. В частности, автоматизируются различные математические методы обработки различного рода информации. Под развитие средств автоматизированной обработки данных, сами математические методы претерпевают модификации.

Современный прогресс средств обработки эмпирической информации можно охарактеризовать следующим образом. С одной стороны, вычислительная техника преодолела путь от больших вычислительных машин, через персональный компьютер и их локальные вычислительные комплексы, до мобильных устройств, которые в большей степени аккумулировали в себе свойства средств связи (нежели вычислительные средства), но приобрели важное свойство мобильности (оно всегда рядом с человеком). С другой стороны, наблюдается большое разнообразие языковых сред программирования для разработки приложений.

Среди методик первичной обработки эмпирических данных выделяются наиболее распространенные: анализ дисперсий, анализ ковариаций и регрессионный анализ. Эти методики в достаточной мере автоматизированы. Существует масса реализаций соответствующего программного приложения, которое либо интегрировано в программные пакеты и оболочки, либо являются автономными. Принципиально, существующее в этой области программное обеспечение (ПО) предназначено для использования при расчетах на стационарных рабочих станциях, либо может быть установлено на ноутбуках. Как правило, такое ПО разработано на языках высокого уровня типа PascalDelphi, C++, C#, FORTRAN, либо встроено в библиотеки интегрированных комплексов типа MatLab и т.п. Оно не предназначено для использования на мобильных устройствах типа Android. Известно, что программное обеспечение Androidов разрабатывается на Java. Таким образом, здесь важно иметь соответствующую операционную систему для разработки прикладного ПО.

В связи с выше изложенным, вырисовываются контуры задачи разработки программного обеспечения для мобильных девайсов. Основная цель таких разработок - это дать возможность исследователю, проводящему натурные эксперименты или наблюдения оперативно провести первичную обработку данных. При этом появляется возможность оперативно вмешаться в методику проведения экспериментов и наблюдений без использования результатов расчетов на локальных стационарных станциях, что экономит время. Очевидно, что разработка библиотеки таких программных средств будет полезным набором необходимого инструментария исследователей в области биологии, ботаники, геологии, инженерных кадастровых работ и т.п.

В качестве элементов такого инструментария выбраны: дисперсионный анализ и анализ ковариаций, которые традиционно объединены в методике под названием ANCOVA, и регрессионный анализ, основанный на одношаговом методе наименьших квадратов 1МНК.

. ОПИСАНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ ОБРАБОТКИ ЭМПИРИЧЕСКИХ ДАННЫХ: ANCOVA И РЕГРЕССИОННЫЙ МЕТОД

1.1Дисперсионный анализ

Суть метода заключается в исследовании влияния одной или нескольких качественных переменных (признаков или, как принято говорить, - факторов-признаков) на одну зависимую (количественную) переменную (отклик). В основе такого исследования лежит гипотеза, что одни переменные могут рассматриваться как причины (независимые переменные): , а другие как следствия (зависимые переменные). В эксперименте независимыми переменными исследователь может варьировать и, соответственно, иметь разные уровни отклика.

Отсюда и основная цель - определение уровня значимости различий между значениями средних на основе сравнения дисперсий. Здесь общая дисперсия делится на несколько источников, а далее дисперсия, вызванная различиями между группами данных, сравнивается с дисперсией, которая опосредована внутригрупповой изменчивостью.

Основная гипотеза, если она верна, заключается в том, что оценка дисперсии, связанной с внутригрупповой изменчивостью, близка в определенном смысле к оценке межгрупповой дисперсии. Таким образом, общая дисперсия разбивается на компоненты, которые опосредованы влиянием вполне определенных факторов на исследуемый признак. Далее эти компоненты сравниваются друг с другом, определяется, какова доля общей вариативности результирующего признака обусловлена влиянием независимых фактор-признаков. Здесь используется известный F-критерий Фишера.

Входными данными для проведения F-тестирования (собственно это основа дисперсионного анализа данных) являются данные исследования нескольких (трех и более) выборок , не обязательно равных по объему и, среди которых не учитывается присутствие объективных связей.

Важно отметить, что дисперсионный анализ относится к параметрическим методам, что обуславливает его применение лишь в тех случаях, когда точно известно, что закон распределения генеральной совокупности является нормальным. Кроме того, дисперсионный анализ применяется в том случае, если зависимая переменная измерена в шкалах отношений, интервалов или порядков. При этом сами регулярные переменные могут иметь нечисловую природу (шкала наименований).

В классической постановке задачи, решаемые методом дисперсионного анализа выглядят следующим образом. Пусть производится анализ влияния на случайную величину фактора , который исследуется на уровнях: . На каждом уровне произведено наблюдений: , случайной величины . Таким образом, на всех уровнях фактора в общей сложности произведено наблюдений.

Далее, расположим все данные экспериментов в таблицу (см. табл. 1.1):

Таблица 1.1 - Данные экспериментов

Номер наблюденияУровни фактора 12……………………………………

В табл. 1.1 обозначено:

.

Будем рассматривать оценки различных дисперсий. Для оценки дисперсии изменения данных на уровне (по строкам), получим

. (1.1)

Согласно предпосылкам дисперсионного анализа, должно выполняться равенство:

. (1.2)

При выполнении (1.2) находим оценку дисперсии рассеяние случайной величины вне зависимости от воздействий фактора :

. (1.3)

Оценка имеет степень свободы, а оценка , соответственно степень. Оценка выборочной дисперсии с использованием всех наблюдений равна:

. (1.4)

Здесь , а .

Тогда

. (1.5)

Введем в рассмотрение оценку дисперсии , которая характеризует вариации математических ожиданий под воздействием фактора .

. (1.6)

Заметим, что оценка имеет степень свободы.

Исследование влияния фактора на вариацию математических ожиданий , сводится к процедуре сравнения дисперсий и . Их оценки соответственно и . Считается, что фактор значительно влияет на изменения математических ожиданий , если значимо отношение . Оно значимо, если с достоверной вероятностью :

. (1.7)

Здесь квантиль F-распределения Фишера с и степенями свободы. Значения квантиля можно найти по таблицам стандартных распределений.

Противный случай: влияние фактора незначимо, т.е. (1.7) не выполняется, а имеет место соотношение: , то для оценки дисперсии может быть применена более точная оценка с степенями свободы, против с степенями свободы.

Алгоритм вычислений.

1.Вычисляются последовательно суммы

. (1.8)

2.Вычисляются

.Сравниваются и . При этом устанавливается уровень значимости фактора . Если:

,

то влияние фактора считается значимым. В противном случае всю выборку можно считать однородной с общей дисперсией .

Замечание. Если на различных уровнях фактора производится разное число наблюдений (экспериментов), то формулы дисперсионного анализа примут вид:

(1.10)

. (1.11)

Здесь количество наблюдений на уровне , . Отношение сравнивается с величиной квантиля .

В качестве иллюстрации выше сказанного, приведем пример.

Пример 1.1.Проведем дисперсионный анализ отвлеченных данных, представленных в таблице (см. табл. 1.2).

Таблица 1.2 - Исходные данных экспериментов

Уровни фактора 13,22,62,93,63,023,13,12,63,43,433,12,73,03,23,242,82,93,13,33,553,32,73,03,52,963,02,82,83,33,1S18,516,817,420,319,11.

.

.

Так как влияние фактора на поведение наблюдаемой случайной величины признается значимым.

1.2Регрессионный метод и анализ ковариаций ANCOVA

Изучение зависимости случайной величины от ряда неслучайных и случайных величин приводят к моделям регрессии и регрессионному анализу на базе выборочных данных. Здесь соответствующий математический инструментарий в отличии от дисперсионного анализа не ставит своей целью установление причинной связи. Хотя, важно отметить, что гипотеза о причинной связи привносится из других теорий и дает возможность содержательно объяснить изучаемые явления.

Для одномерной (парной или множественной) регрессии одна случайная величина (зависимая переменная ) зависит от ряда неслучайных факторов, которые представлены независимыми переменными и от набора случайных величин :

Примером регрессионной зависимости может служить зависимость между урожайностью определенной сельскохозяйственной культуры и влияющими на нее природными и экономическими факторами. Здесь из внестатистических соображений известно, что дожди влияют на урожай, а не наоборот. Следовательно, необходимо изучать зависимость урожайности от дождей и других природно-экономических факторов.

Исходным пунктом приложений регрессионного анализа является ситуация, которую можно описать следующим образом:

.Объект исследования, как и прежде, представляется наблюдаемыми величинами (признаками)

.Между ними предполагается наличие объективной связи. На основе процедур анализа ковариаций (ANCOVA) может быть установлено, что связь между наблюдаемой величиной и наблюдаемыми величинами действительно имеет место.

.В простейшем случае, очевидно, не особенно рассчитывая на высокую степень адекватности, предполагается, что в принципе эту связь между зависимой величиной и независимыми переменными можно представить функцией.

Очевидно, что, если такая функциональная зависимость в принципе действительно существует в природе, то ее точное аналитическое выражение узнать невозможно, а наблюдаемые эмпирические значения ее параметров можно только аппроксимировать. Тогда, по объективным причинам наблюдаемые данные в любом случае будут отклоняться от этой функции.

Для простоты рассуждений будем рассматривать простейшую зависимость в виде линейной функции. Отклонения включаются в модель, причем предполагается, что линейная функциональная связь между наблюдаемыми величинами дополняется аддитивной случайной переменной, которая описывает эти случайные отклонения.

Таким образом, линейное уравнение функциональных связей, называемое регрессионным уравнением, имеет следующий вид

(1.12)

Значения наблюдаемых величин при оценке параметров модели считаются заведомо известными, т.е. по каждой из этих наблюдаемых величин имеется ряд данных (временной или пространственный). Значение случайной переменной и истинное значение каждого из параметров в каждом конкретном случае неизвестны.

Основная цель регрессионного анализа -теоретически обоснованный и статистически надежный точечный и интервальный прогнозы зависимой переменной . Для этого необходимо определить оценки отдельных регрессионных коэффициентов относящихся к наблюдаемым переменным и другие статистические характеристики.

Классическая процедура одношагового метода наименьших квадратов (1МНК). Имеющиеся ряды наблюдений по позволяют для каждого из таких наблюдений получить соотношение

(1.13)

Случайность возмущений делает регрессионную функцию стохастической.

Ряды данных (наблюдений) длиной для переменной и каждой из переменных необходимы для того, чтобы получить статистические оценки параметров модели. Количество рядов равно в каждойиз точек наблюдения: Подставляя наблюдения для каждого получим систему соотношений

операционный программирование android ancova

. (1.14)

Далее введем обозначения:

мерный вектормерная матрица

,

мерный вектор мерный вектор

и (1.14) можно записать в векторном виде: Матрица называется матрицей исходных данных. Ее элементы «шкалируются» относительно фиксированных значений одного из фактор-признаков (например, первого).

Далее к обеим частям соотношения (1.12) применим оператор математического ожидания и получим:

Величину, которую можно прогнозировать с помощью регрессионного уравнения.

При оценке параметров регрессионной функции применяется принцип минимума суммы квадратов ошибок (отклонений).

Алгоритм вычислений.

1.Формирование целевой функции. Вычисляются:

Ошибка или отклонение:;

Квадрат ошибки:

Здесь значения параметров, получаемые в результате оценок.

Сумма квадратов ошибок:

Это и есть целевая функция. Представим ее в виде:

Далее, следуя необходимому условию экстремума функции многих переменных, вычислим частную производную целевой функции и приравняем ее нулю.

мерный вектор мерный вектор

Необходимый признак:

или

В матричном виде:

Здесь неизвестным (искомым) является вектор . В векторной записи имеем:

Подставляя найденные значения в оцениваемое регрессионное уравнение, получим так называемую эмпирическую регрессионную функцию:

(1.15)

С учетом того, что эмпирическая функция регрессии линейная, то дифференцирование ее по каждому из признаков (по переменным ) получим соответствующий эмпирический регрессионный коэффициент в выражении (1.15). Таким образом, изменение этого го слагаемого на единицу, при прочих равных условияхвызовет изменение оцениваемой величины на величину равную .

В качестве иллюстрации рассмотрим пример, где одношаговый метод наименьших квадратов в экспресс-режиме дает возможность получить результат в виде (1.12).

Пример 1.2. Проведена оценка процессоров 10-ти рабочих станций локальной сети, построенной на базе машин приблизительно одного типа, но разных производителей (что предполагает некоторые отклонения параметров работы машин от базовой модели). Для тестирования работы процессоров использована смесь типа ICOMP 2.0 в основу, которой положены два основных теста:

1.125.turb3D - тест моделирования турбулентности в кубическом объеме (прикладное ПО);

Вместе со смесью был применен вспомогательный тест для нормирования времени обработки данных SPECint_base95. Оценка процессоров производилась по взвешенному времени выполнения смеси, нормированному по эффективности базового процессора, в соответствии с формулой

, (1.15)

где время выполнения го теста;

вес го теста;

эффективность базового процессора на м тесте.

Если выражение (1.15) логарифмировать, то получим:

и после переобозначения переменных:

. (1.16)

Здесь:

;

базовое время обработки теста SPECint_base95 ;

логарифм времени обработки первого теста, регрессионный коэффициент, получаемый в оценках (вес теста);

логарифм времени обработки второго теста, регрессионный коэффициент, получаемый в оценках (вес теста);

регрессионный коэффициент - вес теста обработки арифметических операций в целых числах (базовый тест).

По данным измерений, приведенным в таблице, построить регрессионную (эмпирическую) функцию, оценить коэффициенты регрессии и проверить модель на адекватность (вычислить ковариационную матрицу, коэффициенты парной корреляции, коэффициент детерминации).

В таблице 1.3 приведены результаты в масштабе единиц общего выделенного признака :

Таблица 1.3 - Результаты замеров в масштабе единиц первого признака

№ п/п===123413,545,060,026,055,036,035,050,036,043,540,055,051,520,090,062,525,075,072.020,080,083,030,070,0

Очевидно, будем иметь для указанных данных в соответствии с алгоритмом:

Вектор правой части системы нормальных уравнений Гаусса определяется следующим образом (в матричной форме):

Численные значения компонентов вектора регрессионных коэффициентов, оцененные методом наименьших квадратов:

Сама эмпирическая двухфакторная регрессиябудет иметь вид:

Она приводит к следующим прогнозным (расчетным) значениям регрессанда:

Далее рассчитываем компоненты вектора отклонений

и математическое ожидание вектора ошибок:

Близость его значения к нулю свидетельствует о том, что расчеты выполнены верно. Как уже было указано, оценки носят случайный характер, однако, при этом не исключается, что среди них имеется объективная связь. На этом этапе исследований собственно и включается ядро процедуры метода ANCOVA.

По определению, характеристикой взаимосвязи двух случайных величин является их ковариация. Известно, чтоковариацией случайных величин и называется число равное математическому ожиданию произведения отклонений случайных величин и от своих математических ожиданий:

Согласно этому определению ковариации, для совокупной характеристики оценок , дисперсии и ковариации , запишем в виде так называемой ковариационной матрицы:

Ковариационная матрица по эмпирическим данным может быть получена. Она неизвестна, и может быть лишь оценена.

Оцененная матрица:

,

где

Возвращаясь к примеру, укажем, что

и рассчитаем величину следующим образом:

Тогда:

Об уровне связи между оцененными параметрами можно говорить более конкретно, если рассчитать коэффициенты парной корреляции

Их значения по абсолютной величине близки к единице. Это свидетельствует о том, что между параметрами существует достаточно тесная связь.

Важно заметить, что более существенная роль ковариационному анализу отводится при исследованиях авторегрессионных процессов.

Известно, что автокорреляция возмущений означает, что в регрессионном уравнении для периода зависит от возмущений более ранних периодов в том же уравнении. Для простейшего случая, когда имеет место авторегрессионный процесс первого порядка имеем определение.

Возмущение подчиняется авторегрессионному процессу первого порядка, если выполняются следующие условия:

где

(1.17)

Здесь ковариационная матрица, которая имеет следующий вид:

(), непосредственно используется для очистки модели от авторегресси при использовании процедуры метода Эйткена.

2. ОРГАНИЗАЦИЯ СРЕДЫ ПРОГРАММИРОВАНИЯ НА ANDROID

2.1Организация операционной системы

В качестве операционной системы, которая могла бы поддерживать библиотеку программ на С++ можно использовать операционную систему Ubuntu 11.10, которая дает возможности для разработки специализированного программного обеспечения на этом языке и C-подобных языках под Android. Важно отметить, что окружение для разработок настраивается практически с нуля. Операционная среда Ubuntu 11.10 <#"justify">

Рис. 2.1 - Установка операционной системы Ubuntu 11.10

Далее необходима установка интегрированной среды разработки Eclipse.

Краткая характеристика среды разработки приложений. Eclipse - это расширяемая, open-source интегрированная среда разработки (IDE, Integrated Development Environment). Первоначально целью проекта заключалась в разработке стабильной, полнофункциональной, промышленной платформы для создания интегрируемых инструментов. Сейчас Eclipse Consortium складывается из трех основных составляющих:

1.The Eclipse Project (<#"justify">

Если операционная система установлена, то далее необходимо установить среду разработки Eclipse <#"justify">sudo apt-get install eclipse-cdt

Все зависимости Java-приложений, устанавливаются автоматически (см. рис. 2.3).

Рис. 2.3 - Установка Java-приложений

Операции по установке можно параллельно сопровождать установкой Android SDK <#"427" src="doc_zip245.jpg" />

Рис. 2.4 - Окно доступного программного обеспечения

Замечание. По окончании установки ADT Pluginнеобходим перезапуск системы Eclipse.

После перезагрузки, необходимо зайти в меню Window > Preferences, для указания пути к Android SDK, который был ранее распакован (см. рис. 2.5):

Рис. 2.5 - Окно предпочтений

Затем в меню Window > Android SDK and AVD Manager устанавливается поддержка необходимой платформы, например как это показано на рис. 2.6.

Рис. 2.6 - Окно доступных для загрузки пакетов

Для того, чтобы упростить работу с языком программирования приложений С++ необходимо загрузить пакет Sequoyah Android Native Code Support снова в окне доступного программного обеспечения (см. рис. 2.7).

Рис. 2.7 - Выбор пакета Sequoyah Android Native Code Support

Далее, очевидно, следует указать путь к NDK (см. рис. 2.8):

Рис. 2.8 - Окно собственных разработок

Для того чтобы устройство было определено в операционной системе Ubuntu, пользователь с правами администратора (root) должен создать файл/etc/udev/rules.d/51-android.rulesи добавить в него строку вида:

SUBSYSTEM=="usb", ATTR{idVendor}=="04e8", MODE="0666", GROUP="plugdev"

idVendor для устройства выбирается из списка <#"justify">sudo chmod a+r /etc/udev/rules.d/51-android.rules

Для того чтобы убедиться, что устройство подключено необходимо снова обратиться к терминалу (см. рис. 2.9):

Рис. 2.9 - Сообщения на терминале

Таким образом, можно приступить к разработке приложений под Android на C++.

2.2Программная реализация метода 1МНК в среде С++ под Android

Данная программа реализует одношаговый метод наименьших квадратов, который предназначен для построения регрессионных моделей. Для запуска программы необходимо щелкнуть двойным щелчком мыши по ехе-файлу с именем WindowsFormsApplication2.0. В результате появится следующее диалоговое окно:

Рис. 2.10 - Окно для ввода матрицы исходных данных

После запуска программы необходимо в столбец с именем Х1 ввести единицы (единичная матрица), в столбец с именем Х2, Х3 - значения факторных признаков, в столбец с именем Y - значения результативного признака (см. рис. 2.11). При заполнении матрицы, исходные данные взяты из примера 1.2.

Рис. 2.11 - Матрица исходных данных заполнена данными из примера 1.2

Далее необходимо нажать кнопку «считать матрицу».В результате этого в каталоге (папке), где расположена программа появятся файлы с расширением *.txt (см. рис. 2.12):

Рис. 2.12 - Файлы с расширением *.txt

Значения коэффициентов регрессионной модели будут находиться в файле B.txt (см. рис. 2.13).

Рис. 2.13 - Содержимое файла B.txt

Как видно получены те же значения оценок регрессионных коэффициентов, что и в примере 1.2.

Важно заметить, что приведенная выше программа является элементом системы ANCOVA_Androidи может работать автономно, как элемент библиотеки. Исходный код программы WindowsFormsApplication2.0 приведен в Приложениях (см. Приложение А).

. ПРИЛОЖЕНИЯ РАЗРАБОТАННОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ К ОБРАБОТКЕ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

.1Некоторые дополнительные теоретические сведения

Строгие подходы оценивания регрессионной модели в условиях наличия грубых погрешностей в исходных данных основываются на применении помехоустойчивых методов [1]. В отличии от традиционного одношагового метода наименьших квадратов, помехоустойчивый метод приводит к формуле оценивания:

,

где с весами средняя мера рассеяния остатков для данной регрессионной модели, вектор оценок регрессионных коэффициентов.

Вид функции определяет вариант помехоустойчивого метода.

Получаемые в результате применения адаптивного метода временные ряды первых частных производных позволяют не только оценить меру реакции фактор-функции на вариацию фактор-аргументов модели, но и обеспечивают условия для уточнения исходного вида зависимости ; различные предварительные гипотезы о типе функций могут быть проверены исходя из анализа динамики оцененных значений ее дифференциальных характеристик. Выбор вида «опорной» математической модели, то есть регрессионной зависимости, коэффициенты которой подвергаются адаптации, существен. Тем не менее, как показывает опыт расчетов, при оперировании различными вариантами дифференциальных зависимостей указанная неопределенность, как правило, невелика: речь обычно идет о выборе подходящего уравнения из двух-трех вариантов, что всегда осуществимо.

Многофакторные статистические модели используются преимущественно при создании и совершенствовании различных сложных систем. Они особенно необходимы в тех случаях, когда возможности конструирования, производства и эксплуатации, основанные на традиционных физических принципах приводят к нецелесообразно большим затратам.

Здесь, при получении регрессионных моделей необходимо использовать методологию теории планирования экспериментов [2, 3]. Известные традиционные методы планирования многофакторного эксперимента предполагают формы факторных пространств в виде многомерного симплекса. В нестандартных областях факторного пространства поиск наилучших условий получения моделей в общем виде неизвестен, кроме метода регуляризации[7]. Имели место случаи, когда такие задачи были решены численными методами.

Основные причины возникновения нестандартных областей факторного пространства: 1). Параметры (факторы) однородного ряда технических и технологических объектов связаны зависимостью близкой к линейной [4]; 2). Обработка результатов эксперимента при условии, что уровни факторов не могут быть достаточно точно выдержаны по матрице плана эксперимента; 3). Обработка результатов пассивного (специально не организованного) эксперимента.

В нестандартных областях факторного пространства наблюдается корреляция факторов и, следовательно, их главных эффектов и взаимодействий при построении регрессионных моделей. Мультиколлинеарность эффектов (их взаимная сопряженность) затрудняет или делает невозможным устойчивое определение структуры и коэффициентов уравнения регрессии, содержательную интерпретацию причинных и структурных связей между эффектом и моделируемым откликом. При значительной мультиколлинеарности эффектов задача является некорректно поставленной.

В [5] указывается на необходимость устойчивых методов и алгоритмов, обладающих ясными математическими свойствами в смысле оптимальности. Особенностью довольно широко используемого метода наименьших квадратов является его неустойчивость, если не делать каких-либо дополнительных предположений, которые, как правило, трудно проверяемы [6]. Таким образом, при решении прикладных задач, необходимо не только сформулировать систему необходимых предпосылок, но и методики их проверок [7], устойчивость предпосылок и метода получения моделей к сравнительно малым нарушениям принятых условий; систему действий, если предпосылки не выполняются фактически [1].

Обоснование методов устойчивого оценивания структуры и коэффициентов многофакторных статистических моделей для произвольных (нестандартных) форм факторного пространства с наилучшими критериями качества полученных моделей [7]. Идея метода. Факторное пространство, соответствующее многомерному параллелепипеду, принимается за оригинал факторного пространства . Используя методы планирования эксперимента, в оригинале всегда можно найти статистические модели с лучшими характеристиками. Произвольная область факторного пространства, не соответствующая стандартной форме, принимается за образ факторного пространства . Получить в нем модели с наилучшими характеристиками традиционными методами не представляется возможным. Необходимо найти метод перехода от заданного плохо обусловленного факторного пространства образа к хорошо обусловленному факторному пространству оригинала, в котором и необходимо решать задачу.

Предлагается использовать топологическое отображение оригинала факторного пространства в образ. Две системы и при взаимно однозначном и взаимно непрерывном отображении будут изоморфными. При рассмотрении топологического отображения метрические свойства множеств (оригинал) и (образ) не используются, а следовательно и могут иметь разную метрику.

Методы ортогонального представления коррелированных факторов.

.Ортогональность представления коррелированных факторов путем отображения точек оригинала - значений уровней факторов в соответствующие им точки образа - значения уровней факторов [1] (см. рис. 3.1):

. (3.1)

Рис. 3.1 - Системы естественных и собственных кодированных координат областей образа и оригинала для криволинейных граничных условий

Функции и обратные функции должны быть непрерывны. Для случая линейного ограничения формы образа задаются в виде структуры полного факторного эксперимента :

.

Для нелинейного ограничения формы образа используются в качестве границ линии второго порядка и поверхности, полученные на основе структуры многофакторного эксперимента или :

,

где значение фиктивной независимой переменной ; , , …, линейные ортогональные константы факторов ; квадратичные ортогональные константы факторов ; число факторов; общее число структурных элементов, равное соответственно , и ; дробность реплики ( для ) Предполагается, что .

Коэффициенты функции отображения определяются методом наименьших квадратов.

.Отображение точек оригиналов плана эксперимента и точек образов с использованием отображения (3.1) на самом деле представляет собой прием плана эксперимента в пространстве образов, при условии использования оригиналов и образов в собственных кодированных системах координат. Графически это выглядит, например, так как изображено на рис. 3.1.

Согласно лемме Т. Андерсона [8] необходимые свойства оценок коэффициентов статистических моделей в области оригиналов и его единственность сохраняются при топологическом отображении в область образов в точности. Области оригиналов и образов эквивалентны, так как для них выполнено бинарное отношение эквивалентности. Области и являются изоморфными.

.2 Измерения физических параметров

Реальный полноценный эксперимент, в котором было применено разработанное программное обеспечение заключался в определении физико-механических параметров плодов томатов. Собираемые плоды томатов в определенной степени спелости калибровались и далее все откалиброванные плоды томатов были разделены на 10 групп, после чего помечены. 10 плодов томатов были взяты по одному из каждой группы и их основные размеры, такие как продольная высота Н, обжатие диаметра (высота между верхней точкой контакта и нижней точкой контакта в несжатом состоянии), максимальный поперечный диаметр , минимальный поперечный диаметр , были измерены электронным цифровым нутромером с точностью 0,01 мм. Затем средний геометрический диаметр , шарообразность (сферичность) и средний арифметический диаметр были вычислены с использованием следующим формулам:

, (3.3)

. (3.4)

Шарообразность (сферичность) - показатель формы плода, который показывает отличие между реальной формой и сферой. Геометрический средний диаметр и арифметический средний диаметр (среднее геометрическое и среднее арифметическое) указывают частичные диаметры плода, которые описывают размеры по всем направлениям.

Оценка механической повреждаемости. Деформированные после опытов плоды томатов классифицированы по двум видам: сильно деформированные с треснутой кожурой и со средне-легкой деформацией без повреждения кожуры. Внутренняя ткань (мякоть) помидоров с сильной деформацией с течением времени повреждается из-за трещины. Микробы проникают через поверхность плода, и появляется плесень. Разделение между фенолами и энзимами невозможно, потому что в средне-легко деформированных помидорах разрушение происходит на клеточном уровне, что является причиной ряда ферментативных реакций и цвет становится коричневым в точках повреждений. Между тем, «дыхание» плода увеличивается, что приводит к серии биохимических реакций, теряется вода, и околоплодник частично атрофируется. Как очевидный фактор, изменения плода сказывается исключительно на товарной стоимости. В этом исследовании, сохраняемость сильно поврежденных томатов была определена сроками хранения с первого дня тестирования до того дня когда появляется плесень. Сохраняемость средне-легко деформированных томатов была определена сроками хранения с первого дня тестирования до стадии проявления «ущербности».

Другие типы сжатий, аналогичным образом были причиной изменения степени механических повреждений томатов, что привело к изменениям сроков хранения. Так в этих исследованиях, при условиях определенных деформаций, степень механических повреждений может быть оценена по сохраняемости.

Деформация может быть определена по формуле:

, (3.5)

где представляет сжатие диаметра и диаметр плода в течение сжатия. Деформации обработаны в стадиях 0, 4, 8, 12, 16 и 20%. Эталонная сохраняемость томатов составляет дней при деформации в 0%. Это значит, что томат не поврежден, т.е. без какой-либо степени механических повреждений. Сохраняемость составляет дней при деформации , а степень механических повреждений определяется по формуле:

. (3.6)

Статистический анализ. Степень механических повреждений плодов томатов находится под влиянием нескольких факторов, которые могут быть описаны как качественные переменные, такие как число камер, локализация нагрузки; и количественными переменными, такими как деформация и физические параметры плода. В качестве подходящего статистического метода анализа принят ковариационный анализ (ANCOVA). ANCOVA является основной линейной моделью со многими факторными - качественными переменными и непрерывными количественными переменными. ANCOVA является частью дисперсионного анализа (ANOVA) и регрессией непрерывных переменных.

Неуправляемые количественные переменные рассматриваются как независимые переменные в ANOVA, а влияние качественных переменных на зависимую переменную анализируется, когда воздействие независимых переменных исключено, так что качественные переменные более точно могут быть оценены.

Соотношение (3.7) показывает ANCOVA-модель:

, (3.7)

где зависимая переменная, определяющая степень механических повреждений плодов в ой группе; группы были определены по количеству камер, типу опыта и месту приложения усилий; независимые переменные и являются качественными и количественными переменными соответственно, которые показывают основной эффект факторов и независимых переменных; и - число факторов и независимых переменных, соответственно; - свободный член ANCOVA-модели; и относятся к му фактору и ой независимой переменной, соответственно; что описывает важность соответствия переменных; аналогичным образом относится к взаимодействию между м и м факторами; случайная ошибка.

Как статистическая процедура, ANCOVA делает определенные допущения относительно данных вводимых в модель. Только если эти предположения имеют место, по меньшей мере в основном, - ANCOVA будет давать действительные результаты. Особо, ANCOVA требует, чтобы ошибки были нормально распределены и гомосгедастичны. Полная модель многофакторного дисперсионного анализа принимается для проверки, если ее факторы будут оказывать значительное воздействие на зависимые переменные. Чтобы исключить незначащие факторы в модели и обеспечить 5%-ный уровень значимости (95%-ный уровень достоверности) для модели, использована обратная пошаговая процедура. Это означает, что все основные эффекты имеют существенный уровень ниже 0,05 . Наконец, все существенные переменные отсортированы. Для поиска уровней независимого отбора используется метод сравнения совместно с SNK (Стьюдент-Ньюман-Кел) мультиранговый тест (испытание), которые дали возможность определения факторов, оказывающих существенное влияние на зависимые переменные. Параметры модели (3.6) оценены и предсказаны обобщенным линейным моделированием (GLM). Затем была построена статистическая модель, которая дала возможность оценить степень боя (повреждения) томатов с учетом различных внутриструктурных характеристик. Далее, исключая эффекты ковариации зависимых переменных, был проанализирован точный эффект влияния внутренней структуры плодов томата на механические свойства и степень механической повреждаемости. В заключение, был использован анализ остатков для проверки гомоскедастичности. Для проверки гипотезы о нормальном распределении остатков применен D-тест Колмогорова-Смирнова. Если предположение о нормальном распределении подтверждается, это означает, что предыдущие умозаключения являются корректными и вероятными. В противном случае, ANCOVA-анализ повторяется после отыскания причины нарушения нормальности распределения остатков.

Тест «нагружение-разгружение». Данные по механическим, физическим параметрам плодов и сроку хранения приводили к соответствующей оценке степени механической повреждаемости для плодов томатов. В таблице 3.1 представлены результаты, полученные в испытаниях типа «нагрузка-разгрузка» и результаты измерений физических параметров плодов томатов.

Таблица 3.1 - Результаты, полученные в испытаниях типа «нагрузка-разгрузка» и результаты измерений физических параметров плодов томатов

Механические и физические параметрыСжатие (%)048121620, мДж07,21±1,9742,16±15,41101,17±35,99209,09±59,38368,73±128,9, Н09,44±2,5525,97±8,1638,54±10,1654,88±13,4763,13±13,50,63±0,090,59±0,070,55±0,050,5±0,050,41±0,053,62±0,894,85±1,294,59±1,024,53±1,034,5±1,13, мм64,40±4,6565,56±6,4767,27±5,9865,83±4,3267,13±5,910,92±0,040,92±0,020,91±0,020,93±0,030,92±0,02, мм61,30±3,7762,88±4,9863,04±5,5262,47±3,8863,62±4,79, мм61,56±3,8263,16±5,0663,43±5,5762,75±3,9063,92±4,89

Данные представляют усредненные величины для всех групп томатов по типам сжатия. Были применены пять типов сжатия, записаны в пять столбцов таблицы соответственно по механическим и физическим параметрам, ± среднее отклонение для всех томатов: 2×2×10 по типу сжатия. Механические параметры показывают существенную разницу среди эффектов по типам сжатий относительно коэффициента вариации, как показано на рис. 3.2.

Рис. 3.2 - Коэффициент вариации механических и физических параметров плодов томатов

Очевидно, энергия пластической деформации , и пиковое усилие , увеличиваются с увеличением сжатия, как показано в таблице 3.1. Это логично согласуется с результатами других исследователей [9]. Однако, степень пластичности (эластичность) снижается с возрастанием примененных сжатий и уклон кривой нагружения достигает наибольшего значения для сжатия 8 % и наименьшего значения при сжатии 4 %. В отличие от механических параметров, ни один из физических параметров не показывает серьезной разницы средних величин при всех типах нагружения (сжатия). Это иллюстрирует то, что плоды группировались достаточно сбалансированно и полученные данные по тесту «нагружение-разгружение» не были необъективными (тенденциозными). Потому отдельные характеристики плодов были ассоциированы с типом сжатия или типом группировки. Все упомянутые параметры были объясняющими переменными полученного набора данных.

Влияние внутренней структуры томата на его механические свойства. Данные представляют усредненные величины для всех групп томатов по типам сжатия. Были применены пять типов сжатия, записаны в пять столбцов таблицы соответственно по механическим и физическим параметрам, ± среднее отклонение для всех томатов: 2×2×10 по типу сжатия. Механические параметры показывают существенную разницу среди эффектов по типам сжатий относительно коэффициента вариации, как показано на рис. 3.3.

Очевидно, энергия пластической деформации , и пиковое усилие , увеличиваются с увеличением сжатия, как показано в таблице 3.1. Это логично согласуется с результатами других исследователей [10,11]. Однако, степень пластичности (эластичность) снижается с возрастанием примененных сжатий и уклон кривой нагружения достигает наибольшего значения для сжатия 8 % и наименьшего значения при сжатии 4 %. В отличие от механических параметров, ни один из физических параметров не показывает серьезной разницы средних величин при всех типах нагружения (сжатия). Это иллюстрирует то, что плоды группировались достаточно сбалансированно и полученные данные по тесту «нагружение-разгружение» не были необъективными (тенденциозными). Потому отдельные характеристики плодов были ассоциированы с типом сжатия или типом группировки.

Механические параметры после теста «нагружение-разгружение» вдоль камеры и вдоль перегородки (между камерами) томатов для пяти типов сжатий показаны на рис. 3.3:T×CW; T×L; F×CW; F×L - диаграммы и графики для трехкамерных томатов под нагрузкой вдоль перегородки, трехкамерный томат под нагрузкой вдоль камеры; четырехкамерный томат под нагрузкой вдоль перегородки и четырехкамерный томат под нагрузкой вдоль камеры, соответственно.

Рис. 3.3а - Трехкамерный томат,

Рис. 3.3б - Трехкамерный томат

Рис. 3.3в - Трехкамерный томат,

Рис. 3.3г - Трехкамерный томат,

Рис. 3.3д - Четырехкамерный томат,

Рис. 3.3е - Четырехкамерный томат,

Рис. 3.3ж - Четырехкамерный томат,

Рис. 3.3з - Четырехкамерный томат,

Трехкамерный томат. Корреляции между различными механическими параметрами трехкамерных томатов для пяти типов сжатия показаны на рис. 3.3а, 3.3б, 3.3в и 3.3г.

. Энергия пластической деформации (рис. 3.3а): когда сжатие меньше 16% место приложения нагрузки не играет существенной роли (не показывает существенных эффектов). Когда сжатие более 16%, изменения величин этих показателей в зависимости от места приложения нагрузки становится более заметным: разница значений показателей растет со степенью сжатия. Когда сжатие достигает 20%, энергия пластической деформации томатов с нагрузкой вдоль перегородки в ~1,15 раза больше, чем при сдавливании вдоль камеры.

. Пиковое усилие (рис 3.3б) и степень пластичности (рис. 3.3в). Очевидно, место приложения нагрузки не имеет существенного эффекта для пиковых усилий и степени пластичности для трехкамерных томатов. Усилие с пиковой нагрузкой при сдавливании вдоль камеры томата незначительно больше, чем при сдавливании вдоль перегородки при сжатиях менее 12%. Когда сжатие превысило 12%, пиковое усилие нагружения на камеру было несущественно меньше, чем на перегородку. Степень пластичности томатов приводит к тому, что сжатие вдоль камеры немного больше, чем сжатие вдоль перегородки по всем типам сжатий.

. Угол наклона линии нагружения (рис. 3.3д): Место приложения нагрузки имеет существенный эффект (влияние) по уклону линии нагружения для трехкамерных томатов. Когда сжатие меньше, чем 12%, угловой коэффициент линии нагружения в испытаниях томатов показывает значения при сжатии по камере больше, чем по перегородке. Когда сжатие больше, чем 12%, уклон линии нагружения при сдавливании по камере меньше, чем тот же параметр при сдавливании вдоль перегородки. При сжатии 4% уклон при нагружении по камере в 1,3 раза больше, чем тот же параметр при сдавливании по перегородке.

В соответствии с результатами тестов, приведенными выше, место приложения нагрузки не имеет существенного эффекта по механическим параметрам (, и ) для трехкамерных томатов, когда сжатие не превышает 16%. Это происходит потому, что структура трехкамерных томатов центрально симметрична. Неважно, какое положение перегородок между двумя позициями нагрузок - механические свойства не будут существенно различными до того как внутренняя структура томата разрушится. Как бы ни было, расположение нагрузок имеет существенный эффект по отношению к уклону линии нагружения для трехкамерных томатов, и причина может быть в соотношениях между данными по диаметрам.

Энергия пластического нагружения существенно зависит от места приложения нагрузок, когда сжатие превышало 16%; причина возможно в том, что внутренняя структура томатов начинает разрушаться постепенно.

Результаты статистической обработки после тестов показывают, что вероятность разрушения томата, нагруженного вдоль перегородки и вдоль камеры соответственно равны 0,8333 и 0,6667, когда сжатие было 16%. Обе вероятности равнялись 1,0 когда сжатие равнялось 20%.

Четырехкамерный томат. Корреляции между разными механическими параметрами четырехкамерного томата и пятью типами сжатий показаны на рис. 3.4д, 3.4е, 3.4ж и 3.4з.

. Энергия пластического напряжения (рис. 3.3д): Когда сжатие было меньше, чем 12%, расположение нагрузки не имело значительных эффектов по отношению к величине энергии пластического нагружения для четырехкамерного томата. Когда сжатие было больше 12%, место приложения нагрузки стало значимость, и разница величины энергии пластического напряжения томатов для двух локализаций расположения нагрузки растет с ростом степени сжатия. Когда сжатие принимает значения 16% и 20%, соответственно, энергия пластической деформации томатов при нагружении вдоль перегородки соответственно в ~1,2 раза и в ~1,5 раз больше, чем при нагружении вдоль камер.

. Пиковые усилия (рис. 3.3е): Очевидно, место нагружения не имеет существенного эффекта по пиковым усилиям для четырехкамерных томатов. Пиковые усилия, приложенные к камерам томатов несущественно больше, чем приложенные вдоль перегородок для всех типов нагружения при сжатии менее 16%. Когда сжатие становится более 16% изменения пиковых нагрузок вдоль камер небольшие. Однако, усилия пиковых нагрузок на ткань камер продолжает расти.

. Степень эластичности (рис. 3.3ж): Место приложения нагрузок имеет существенный эффект по степени эластичности для четырехкамерных томатов. Степень эластичности томатов нагружаемых вдоль камер больше, чем нагруженных вдоль перегородок по всем типам нагружения. Максимальное отношение степени эластичности для двух позиций (вдоль перегородок и вдоль камер) достигает 1,15 : 1 при 4%. Это показывает, что способность упругого восстановления четырехкамерных томатов при нагрузке вдоль камер выше, чем при нагрузке вдоль перегородок.

. Уклон кривой нагружения (рис. 3.3з): Место нагружения имеет существенный эффект по уклону кривой нагружения для четырехкамерных томатов. Уклон кривой нагружения в тесте томатов, нагруженных вдоль камер меньше, чем в тесте томатов нагруженных вдоль перегородок для всех типов сжатий. Максимальное отношение уклона кривой нагружения в двух позициях (вдоль камер и вдоль перегородок) достигает 1,35 : 1 при 20% сжатия. Это иллюстрирует, что если томат имеет туже самую деформацию, усилие зажима плодов томатов вдоль перегородок должно быть больше чем вдоль камер.

В соответствии с приведенными выше результатами тестов, сжатие в 12% ключевая точка изменений для механических параметров четырехкамерных томатов. Причина в том, что четырехкамерные томаты начинают разрушаться, когда сжатие больше чем 12%. Рис. 3.3з показывает, что степень эластичности томатов внезапно падает, когда сжатие больше 12%; пластические деформации значительно усиливаются и пластическая энергия разрушения также растет с ростом сжатия. Статистическая обработка показывает, что вероятность того, что томат лопнет для сжатий вдоль перегородок и вдоль камер равна 0,33 и 0,17, соответственно, когда сжатие равно 12%; 0,50 и 0,33соответственно, для сжатий 16%; 1,00 и 0,83соответственно, для сжатий 20%. Таким образом, дальнейшие результаты показали правильность выше сформулированных предположений.

В экспериментах получены основные размеры плодов томатов, такие как продольная высота Н, диаметр (расстояние между верхней точкой контакта и нижней точкой контакта в несжатом состоянии), максимальный поперечный диаметр , минимальный поперечный диаметр . Затем, по формулам вычислены: средний геометрический диаметр , шарообразность (сферичность) и средний арифметический диаметр

.

Для оценки механической повреждаемости, деформированные после опытов плоды томатов, были классифицированы по двум группам: сильно деформированные с треснутой кожурой и с незначительной деформацией без повреждения кожуры. Степень деформации определена по формуле:

,

где функция диаметра плода в течение процесса сжатия. Деформации фиксировались в стадиях 0, 4, 8, 12, 16 и 20%. Степень механических повреждений определяется по формуле: , где - время сохраняемости плода томата при деформации .

Степень механических повреждений плодов томатов находится под влиянием нескольких факторов, которые могут быть описаны как качественные переменные: число камер, локализация нагрузки; и количественными переменными: деформация и физические параметры плода. В качестве метода анализа принят ковариационный анализ (ANCOVA), который является составляющей дисперсионного анализа (ANOVA) и регрессией непрерывных переменных [12].

Неуправляемые количественные переменные рассматриваются как независимые переменные, а влияние качественных переменных на зависимую переменную анализируется, когда воздействие независимых переменных исключено. Соотношение:

это ANCOVA-модель. Здесь зависимая переменная, определяющая степень механических повреждений плодов в ой группе; группы были определены по количеству камер, типу опыта и месту приложения усилий; независимые переменные и являются качественными и количественными переменными соответственно; и - число факторов и независимых переменных, соответственно; - свободный член ANCOVA-модели; и относятся к му фактору и ой независимой переменной, соответственно; аналогичным образом относится к взаимодействию между м и м факторами; случайная ошибка.

Факторы, оказывающие влияние на степень механической повреждаемости томатов, включают параметры внутренней структуры, такие как: камерность и место приложения усилий сжатия; механические параметры, такие как: , , и , и физические параметры, такие как , , , .

Таблица 3.2 - Коэффициенты модели степени повреждаемости томатов

Объясняющие (Х)Оценка коэффициентов ()Стандарт-ная ошибкастатистика1234Свободный член модели- 0,10870,0515- 2,11Сжимаемость 3,63750,312511,64Положение CW0,2130,054,26Положение L0Структура × Положение T×CW- 0,16340,05- 3,27Структура × Положение F×CW0Структура × Положение T×L0,04880,050,98Структура × Положение F×L0

В этой модели коэффициент: (91% данных, гарантировано, объясняется моделью). Диаграмма рассеивания остатков (рис. 3.5), показывает, что распределение остатков не является регулярным и гипотеза гомоскедастичности ошибок верна.

Рис. 3.5 -Тестирование гипотез

В Приложении А приведен исходный код программы WindowsFormsApplication2.0,которая реализует процедуру построения регрессионной функции по эмпирическим данным качественных и количественных признаков на основе модификаций одношагового метода наименьших квадратов. Программа реализована в среде С++, обработка данных производится в оконной системе.

4.1Анализ условий труда разработчика

Основные виды деятельности разработчика ПО в пределах проекта включают в себя: анализ и поиск способов и методов решения задачи, собственно программирование, отладку и тестирование программных модулей, оформление технической документации. Значительная часть этих работ предполагает активное пользование вычислительной техникой. Таким образом, здесь важно отметить: зрительные нагрузки, малую двигательную активностью, рутинность операций и т.п. Наиболее существенные внешние факторы воздействия на организм: электромагнитное поле мониторов, освещение, шум, вынужденная поза за рабочим местом.

Рабочее место разработчика, оборудуется согласно требованиям СанПиН 2.2.2.542-96, ГОСТ Р 50923-96, ГОСТ 12.2.032-78 «Рабочее место при выполнении работ сидя».

На рабочем месте программиста располагается следующее оборудование: системный блок, клавиатура, монитор, манипулятор типа «мышь», принтер, сканер.

Согласно санитарным нормам, уровень шума не должен превышать среднего значения 50 дБ. Оптимальные климатические условия: температура воздуха

Copyright © 2018 WorldReferat.ru All rights reserved.