Технологические решения интеллектуальной обработки данных в пищевой промышленности

Автор: Никитина М.А., Пчелкина В.А., Кузнецова О.А.

Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet

Рубрика: Пищевая биотехнология

Статья в выпуске: 2 (76), 2018 года.

Бесплатный доступ

Статья посвящена возможностям применения искусственных нейронных сетей (ИНС), которые представляют собой математическую модель, а также ее программное или аппаратное воплощение, построенную по принципу организации и функционирования сетей нервных клеток живого организма. Сверточные нейронные сети устроены наподобие зрительной коры головного мозга и достигли большого успеха в распознавании изображений, они умеют концентрироваться на небольшой области и выделять в ней важные особенности. Отмечено широкое использование ИНС в медицине для оценки рентгенограмм, уровня артериального давления и индекса массы тела пациентов по анализу их сетчатки. Перспективным является применение ИНС в пищевой промышленности для осуществления входного контроля качества сырья. В мировой практике применяют разные методы дистанционного контроля сырья, для этого в основном используют приборы на основе ультразвукового сканирования. Такие приборы и системы анализа осуществляют контроль сырья по соотношению тканей мяса (мышечной, соединительной, жировой) в туше или полутуше, не затрагивая структуру тканей, не проводят оценку качества на клеточном (микроструктурном) уровне...

Еще

Информационные технологии, искусственная нейронная сеть, дистанционный контроль сырья, гистологический анализ

Короткий адрес: https://sciup.org/140238575

IDR: 140238575   |   DOI: 10.20914/2310-1202-2018-2-256-263

Текст научной статьи Технологические решения интеллектуальной обработки данных в пищевой промышленности

Нейросетевые технологии – это один из старейших алгоритмов машинного обучения. Искусственная нейронная сеть (ИНС) представляет собой математическую модель, а также её программное или аппаратное воплощение, построенную по принципу организации и функционирования биологических нейронных сетей – сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Первой такой попыткой были нейронные сети Уоррена Маккалока и Уолтера Питтса, ими же в 1943 г. был предложен первый формальный нейрон – ячейка нейронный сети [1]. В 1958 году Фрэнк Розенблатт предложил первую самую простую нейронную сеть, которая уже могла разделять объекты в двухмерном пространстве.

В последнее время ИНС обрели вторую жизнь. Это обусловлено несколькими причинами, а именно:

  • 1.    Объем данных. В отличие от большинства алгоритмов ИНС очень критичны к объему данных, к объему обучающей выборки, которая необходима для того, чтобы их натренировать. На маленьком объеме данных сети плохо работают: они плохо обобщают, плохо работают на примерах, которые они не видели в процессе обучения;

  • 2.    Вычислительные ресурсы. ИНС – один из самых тяжеловесных алгоритмов машинного обучения. Необходимы огромные вычислительные ресурсы, не только чтобы обучить нейронную сеть, но, и чтобы ее применять. И сейчас такие ресурсы есть;

  • 3.    Новые алгоритмы. Наука не стоит на месте, и теперь мы больше понимаем о том, как обучать подобного рода структуры.

Формальный нейрон h – очень простой элемент, у которого есть какое-то ограниченное количество входов (х1…, xn), к каждому из этих входов привязан некоторый вес (w1…, wn), и нейрон h осуществляет взвешенную суммацию своих входов. На входе могут быть, например, пиксели изображения. Структура формального нейрона представлена на рисунке 1.

Рисунок 1. Структура формального нейрона

Figure 1. Structure of a formal neuron

Ячейка нейрона осуществляет взвешенную суммацию входов и осуществляет нелинейное преобразование.

(a) архитектура CNN| architecture of CNN

Рисунок 2.Сверточная нейронная сеть

Figure 2. Convolution neural network (CNN)

(b) свертка изображения | image convolution

Изначально при анализе и классификации изображений нейронные сети показывали посредственные результаты. Это наблюдалось до момента разработки новой архитектуры ИНС – сверточной нейронной сети (CNN). Под CNN люди обычно подразумевают компьютерное зрение. CNN лежали в основе прорывов в классификации изображений – знаменитый AlexNet, победитель соревнования ImageNet в 2012 году, с которого начался бум интереса к этой теме. С тех пор CNN достигли большого успеха в распознавании изображений, в силу того факта, что они устроены наподобие зрительной коры головного мозга, то есть умеют концентрироваться на небольшой области и выделять в ней важные особенности

В архитектуре CNN (рисунок ) каждый из нейронов подсоединен только к небольшой части изображении.

Работа CNN обычно интерпретируется как переход от конкретных особенностей изображения к более абстрактным деталям, и далее к ещё более абстрактным деталям вплоть до выделения понятий высокого уровня. При этом сеть самонастраивается и вырабатывает необходимую иерархию абстрактных признаков (последовательности карт признаков), фильтруя маловажные детали и выделяя существенное.

На рисунке 2b представлен этап свертки изображения. В центре находится ядро свертки – это совокупность весов этого нейрона. Применяя ядро свертки во всех пикселях изображения последовательно, осуществляется взвешивание пикселей в этом квадрате на веса, таким образом, получаем некоторое новое значение. Можно сказать, что мы преобразовали картинку, прошлись по ней фильтром и получили некоторое преобразованное изображение. Впервые ИНС распознала цифры в 1993 году (Ян Лекун, Париж).

Основная часть

Решения на основе нейронных сетей на данный момент показывают самые лучшие результаты в различных областях человеческих знаний. Одним из важных применений ИНС является обработка изображений в медицине, другая область – промышленность. В качестве примеров приводим наиболее значимые результаты использования ИНС в 2018 году:

  • 1.    Разработчики Стэнфордского университета (коллектив ученых факультетов информатики, медицинского и радиологии) представили крупномасштабную базу данных скелетномышечных рентгенограмм (MURA), содержащую более 40 тысяч рентгеновских снимков поврежденных конечностей, полученных в ходе 14982 исследований, где результат каждого исследования был вручную помечен радиологами как «нормальный» или «ненормальный (паталогический)» [3].

  • 2.    Компания VerilyLifeSciences (холдинг Alphabet) разработала алгоритм, который определяет возраст, пол и различные медицинские показания (например, уровень артериального давления или индекс массы тела) пациентов по анализу их сетчатки [4]. Такой метод диагностики может помочь в прогнозировании сердечно-сосудистых заболеваний.

  • 3.    Китайский ИТ-гигант Alibaba подписал контракт с производителями свиней DekonGroup и корма для скотины TequGroup на разработку и внедрение ИИ-системы, которая позволит следить за многомиллионным поголовьем [5]. Сделка с Alibaba стоимостью в несколько миллионов долларов предполагает замену радиочастотной идентификации на технологию машинного зрения. Идея состоит в том, чтобы отслеживать свиней с помощью камер, которые будут вести учет скотины, ориентируясь на клейма с ID на их спинах. Первоначально система будет только пересчитывать свиней и поросят, но впоследствии Alibaba собирается ее усовершенствовать и предложить более комплексные решения.

На основании этого набора данных была обучена 169-слойная сверточная нейронная сеть для выявления и локализации аномалии. Эффективность распознавания натренированной нейросети сравнивали с работой трех врачей радиологов: нейросеть правильно определила повреждения почти в 75 (74,9)% случаев. Этот показатель оказался выше результата одного из участвовавших в исследовании врачей. База данных MURA выложена в открытый доступ на сайте Стэндфордского университета

Для обучения алгоритма ученые использовали 284335 изображений сетчатки, соотнесенных с несколькими показателями: пол, возраст, артериальное давление, индекс массы тела и гликированный гемоглобин – биохимический показатель, отражающий среднее содержание глюкозы в крови за длительный период (до 3 мес.). Также использовали информацию о курении, и о развитии сердечно-сосудистых заболеваний в течение 5 лет после первоначального сбора данных.

Разработанный классификатор протестировали на двух независимых базах данных (12026 и 999 участников). Ученым удалось эффективно предсказать биологические показатели участников, и определить риск развития сердечно-сосудистых заболеваний с точностью 70%.

Крупные базы данных способствовали появлению алгоритмов глубокого обучения, которые в таких задачах, как распознавание изображений [6], распознавание речи [7] и ответы на вопросы [8], достигают или приближаются по эффективности к уровню человека. В выявлении диабетической ретинопатии [9], рака кожи [10], сердечных аритмий [11], кровоизлиянии в мозг [12], пневмонии [13] и переломов бедра [14] крупномасштабные медицинские базы данных обеспечивают эффективность на уровне эксперта.

Растут усилия по созданию общедоступных хранилищ медицинских рентгенограмм. В таблице 1 представлена сводка общедоступных баз данных медицинских рентгенографических изображений. Предыдущие базы данных были меньшего масштаба, чем MURA, за исключением недавно запущенной СhеstХ-rау14 [15], которая включает в себя 112120 фронтальных рентгенограмм грудной клетки, содержащих до 14 заключений о патологиях. Однако эти заключения не были получены напрямую от радиологов, а были автоматически сгенерированы из текстовых отчетов радиологов.

Таблица 1.

Обзор общедоступных баз данных медицинских рентгенографических изображений

Table 1.

Overview of the publicly available radiographic imaging databases

База данных Data base

Типы исследований Types of research

Заключение Conclusion

Изображения, шт. Images, pcs.

MURA

Скелетно-мышечные (верхниеконечности) Musculoskeletal (upper extremities)

Аномалия Anomaly

41299

Pediatric Bone Age (AIMI)

Скелетно-мышечные(кисть) Musculoskeletal (hand)

Костный возраст Bone age

14236

0.E.1 (OAI)

Скелетно-мышечные (колено) Musculoskeletal (knee)

Классификацияпо K&L Classification by K&L

8892

Digital Hand Atlas (Gertych, 2007)

Скелетно-мышечные (левая кисть) Musculoskeletal (left hand)

Костный возраст Bone age

1390

Сhеst Х-rау14 (Wang, 2017)

Грудная клетка Сhеst

Множественные патологии Multiple pathologies

112120

Openl (Demner-Fushman, 2015)

Грудная клетка Сhеst

Множественные патологии Multiple pathologies

7470

MC (Jaeger, 2014)

Грудная клетка Сhеst

Аномалия Anomaly

138

Shenzhen (Jaeger, 2014)

Грудная клетка Сhеst

Туберкулез Tuberculosis

662

JSRT (Shiraishi, 2000)

Грудная клетка Сhеst

Легочные узелки Pulmonary nodules

247

DDSM (Heath, 2000)

Маммограмма Mammogram

Рак молочной железы Mammary cancer

10239

Перспективным, на наш взгляд, является применение ИНС в пищевой промышленности. Сегодня перерабатывающие предприятия стремятся максимально повысить качество выпускаемой продукции, при этом огромное значение приобретает входной контроль качества сырья. В мировой практике применяют разные методы дистанционного контроля сырья, в том числе при поточной переработке в режиме реального времени. Цели контроля могут быть разные, и в соответствии с ними используют аппаратуру, работающую на различных физических принципах получения и обработки поступающей информации [16].

Так, например, в мясной промышленности мясные туши классифицируют по содержанию мышечной ткани по стандарту EUROP, для этого в основном используют приборы на основе ультразвукового сканирования.

В Швеции применяется система Telematib (компания StamosAB), в соответствии с которой классификация туш основана на оценке выхода мяса по косвенным показателям упитанности: развитию мускулатуры и толщине жировых отложений.

В Австрии разработан аппарат с автоматическим регулируемым зондирующим щупом, модель ElectronicPG 200 (товарная марка «PorkGrader») компании «Giralda-Opto-ElektronikGmbН» и «Co EntwickimsKG». Щуп вводят в полутушу на глубину 10 см между вторым и третьим ребрами, при выводе из мяса расположенный в приборе процессор по оценке коэффициентов отражения света от внутреннего слоя полутуши рассчитывает линейные размеры шпика и мышечной ткани, определяет процентную долю мяса и соотносит ее с торговой классификацией. Аппарат оснащен устройством для ввода сопутствующих данных.

В Новой Зеландии разработан индикатор для измерения жирового слоя (компания Hen-nessyand ChongFat) – прибор FDI (FatDepth

Indicator) прокалывающего типа, который определяет толщину шпика на основании измерения отражения света зондом длиной 50 мм [19]. Система выполняет следующие функции:

─ поставляет данные по классу качества убойных животных в зависимости от содержания мяса (это сортировка служит документом при расчете с производителями свинины);

─ при помощи устройства ввода и вывода данных осуществляется сбор информации;

─ делает рисунки полутуш с обозначением класса качества, номера туш и результаты ветеринарного осмотра;

─ собирает данные результатов их классификации для статистической обработки и долгосрочного хранения при проведении научных исследований.

В Великобритании электронная система установки определяет длительность прохождения ультразвукового импульса через туловище животного, записывает расстояние между передающим и принимающим устройствами и рассчитывает скорость прохождения ультразвука. С помощью этой установки определяют общее количество жировой ткани, подкожного межмышечного и внутримышечного жира.

В Германии применяют прибор «СSВ-Ultra-Meat», Технология его работы состоит из высоко производительного программного обеспечения, которое вводит изображение объекта, идентифицирует его и выдает результаты измерений в визуальном виде. Классификация сырья производится путем анализа фотоизображения свиной полутуши в поясничной области (рисунок 3) .

Рисунок 3. Интерфейс CSB-Ultra-Meat

Figure3. InterfaceofCSB-Ultra-Meat

В России ВНИИМПом совместно с учеными Датского НИИ мясной промышленности на базе АО «Смолмясо» были проведены работы по монтажу, пуску и наладке системы оценки туш на линии первичной переработки скота и осуществлена разделка по датскому и кульмбахскому методам.

Однако приведенные приборы и системы анализа осуществляют контроль сырья, преимущественно, по соотношению тканей мяса (мышечной, соединительной, жировой) в туше или полутуше, не затрагивая структуру самих тканей, а соответственно и их качество на клеточном уровне.

В Указе Президента РФ от 01.12.2016 № 642 «О Стратегии научно-технологического развития Российской Федерации» отмечается, что «в ближайшие 10–15 лет приоритетами научно-технического развития Российской Федерации следует считать переход к передовым интеллектуальным производственным технологиям, эффективную переработку сельскохозяйственной продукции, создание безопасных и качественных, в том числе функциональных, продуктов питания».

Таким образом, разработка экспертной системы контроля качества мясного сырья на микроструктурном уровне с использованием современных интеллектуальных технологий, а именно искусственных нейронных сетей и компьютерного зрения является актуальным и социально-значимым направлением развития мясной промышленности.

В соответствии с этим цель нашей работы заключается в разработке системы на основе искусственной нейронной сети и ее обучении для оценки микроструктурных показателей качества мясного сырья.

Помимо мясного сырья с «нормальными» качественными характеристиками (NOR), на производство может поступать сырье DFD (Dark, Firm, Dry – темное, твердое, сухое), PSE (Pale, Soft, Exsudative – бледное, мягкое, водянистое). Главным общепринятым признаком мясного сырья с отклонениями качества является изменение рН через час после убоя (рН1), и рН мяса по прошествии 24 часов (рН24). Однако такое сырье различается и по структуре мышечной ткани [20]. В парном мясе DFD, например, мышечные волокна по сравнению с мясом NOR набухшие, плотно прилегают друг к другу и характеризуются стертой поперечной и продольной исчерченностью, нарушены тинкториальные свойства ткани, клеточные органеллы часто демонстрируют признаки деструкции [21]. Максимальный диаметр мышечных волокон и минимальная порозность мышечной ткани наблюдается в мясе DFD, минимальный диаметр мышечных волокон с наиболее рыхлой упаковкой в ткани характерен для мяса качественной группы PSE, в то время как мясо качественной группы NOR находится по указанным параметрам в промежуточном положении [22, 23] (рисунок 4a –c).

(a) Мясо NOR (об. х20) | NOR meat (ob. х20)

(b) Мясо PSE (об.х20) |PSE meat (ob. х20)

(c) МясоDFD (об.х20) | DFD meat (ob. х20)

По структуре мышечной ткани, степени ее порозности, целостности мышечных волокон можно судить и о термическом состоянии сырья: охлажденное, замороженное, а также о соблюдении режимов температурной обработки. Наличие в структуре мяса посторонних компонентов (крахмал, каррагинан, соевые белки), говорит об инъецировании сырья (рисунок 4d –f).

Заключение

Приведенные микроструктурные показатели (диаметр мышечных волокон, сохранность клеточных элементов, порозность ткани, наличие немясных компонентов) могут быть положены в основу обучающейся выборки ИНС. Таким образом, по структуре ткани на клеточном уровне система будет делать вывод о качестве мясного сырья.

Список литературы Технологические решения интеллектуальной обработки данных в пищевой промышленности

  • Мак-Каллок У.С., Питтс В. Логическое исчисление идей, относящихся к нервной активности//Автоматы. 1956. С. 363-384.
  • Le Cun Y., Ranzato M. DeepLearning. Tutorial ICML, Atlanta, 2013. URL: http://www.cs.nyu.edu/~yann/talks/lecun-ranzato-icml2013.pdf
  • Bone X-Ray Deep Learning Competition. URL: https://stanfordmlgroup.github.io/competitions/mura.
  • Poplin R., Varadarajan A.V., Blumer K., Liu Y. et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning//Nature Biomedical Engineering volume. 2018. № 2. P. 158-164. 10.1038/s41551-018-0195-0 DOI: 10.1038/s41551–018–0195–0
  • Chinese farmers are using AItohelprear the world’s biggest pig population. URL: https://www.theverge.com.
  • Deng J., Dong W., Socher R., Li L. -J. et al. A large-scale hierarchical image database//Computer Vision and Pattern Recognition. CVPR 2009. IEEEConferenceon. 2009. P. 248-255.
  • Hannun A., Case C., Casper J., Catanzaro B. et al. Deepspeech: Scalingupend-to-endspeechrecognition. arXivpreprintarXir. 2014.
  • Rajpurkar P., Zhang J., Lopyrev K., Liang P. Squad:100,000+ questions for machine comprehension of text. arXiv preprint arXiv. 2016.
  • Gulshan V., Peng L., Coram M., Stumpe M.C. et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs//Jama. 2016. № 316(22). P. 2402-2410.
  • Esteva A., Kuprel B., Novoa R.A., Ko J. et al. Dermatologist-level classification of skin cancer with deep neural networks//Nature. 2017. № 542(7639). P. 115-118.
  • Rajpurkar P., Hannun A.Y., Haghpanahi M., Bourn C. et al. Cardiologist-level arrhythmia detection with convolutional neural networks. arXiv preprint arXiv. 2017.
  • Grewal M., Srivastava M.M., Kumar P., Varadarajan S. Radnet: Radiologist level accuracy using deep learning for hemorrhage detection in ct scans. arXiv preprint arXiv. 2017.
  • Rajpurkar P., Irvin J., Zhu K., Yang B. et al. Chexnet: Radiologist-level pneumonia detection on chest x-rays with deep learning. arXiv preprint arXiv. 2017.
  • Gale W., Oakden-Rayner L., Carneiro G., Bradley A.P. et al. Detecting hip fractures with radiologist-level performance using deep neuralnetworks/arXiv e-prints. 2017.
  • Wang X., Peng Y., Lu L., Lu Z. et al. Chestx-ray8: Hospital-scale chest x-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. arXiv preprint arXiv. 2017.
  • Пляшечник П.И., Глебочев С.Н., Шихов С.С. Сырье под контролем//Мясная индустрия. 2015. № 1. С. 37-39.
  • The Best & Donovan Acra-Grade System. Operation and Maintenance Manual. Revision 4. URL: http://www.bestand-donovan.com/acragrademanual.html#overview.
  • AutoFom III. Fully Automatic Ultrasonic Carcass Grading. Available at: http://www.carometec.com/products/item/autoform-III.
  • Kutsky J.A., Savell J.W., Johnson D.D., Smith G.C. et al. Predicting cutability of pork carcasses and hams using the Hennessy and Chong Fat Depth Indicator//Meat science. 1984. № 11. P. 13-26.
  • Listrat A., Lebret B., Louveau I. et al. How Muscle Structure and Composition Influence Meat and Flesh Quality//The Scientific World Journal. 2016. P. 3182746 DOI: 10.1155/2016/3182746
  • Enikel D. Structure of muscle and meat quality//Fleischwirtschaft. 1987. № 4. P. 461-465.
  • Bendall I.R., Swatland H.J. A review of the relationships of pH with physical aspects of quality//Meat Science. 1988. № 2(24). P. 85-126.
  • Hvilia S.I. Comparative electronic histochemical analysis of meat with DFD and PSE defects//Technologija mesa. 1999. № 1(40). P. 13-16.
Еще
Статья научная