Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2288-0992(Print)
ISSN : 2288-100X(Online)
Protected Horticulture and Plant Factory Vol.28 No.2 pp.95-103
DOI : https://doi.org/10.12791/KSBEC.2019.28.2.95

Prediction of Air Temperature and Relative Humidity in Greenhouse via a Multilayer Perceptron Using Environmental Factors

Hayoung Choi, Taewon Moon, Dae Ho Jung, Jung Eek Son*
Department of Plant Science and Research Institute of Agriculture and Life Sciences, Seoul National University, Seoul 08826, Korea
Corresponding author: sjeenv@snu.ac.kr
January 11, 2019 February 22, 2019 February 25, 2019

Abstract


Temperature and relative humidity are important factors in crop cultivation and should be properly controlled for improving crop yield and quality. In order to control the environment accurately, we need to predict how the environment will change in the future. The objective of this study was to predict air temperature and relative humidity at a future time by using a multilayer perceptron (MLP). The data required to train MLP was collected every 10 min from Oct. 1, 2016 to Feb. 28, 2018 in an eight-span greenhouse (1,032 m2) cultivating mango (Mangifera indica cv. Irwin). The inputs for the MLP were greenhouse inside and outside environment data, and set-up and operating values of environment control devices. By using these data, the MLP was trained to predict the air temperature and relative humidity at a future time of 10 to 120 min. Considering typical four seasons in Korea, three-day data of the each season were compared as test data. The MLP was optimized with four hidden layers and 128 nodes for air temperature (R2 = 0.988) and with four hidden layers and 64 nodes for relative humidity (R2 = 0.990). Due to the characteristics of MLP, the accuracy decreased as the prediction time became longer. However, air temperature and relative humidity were properly predicted regardless of the environmental changes varied from season to season. For specific data such as spray irrigation, however, the numbers of trained data were too small, resulting in poor predictive accuracy. In this study, air temperature and relative humidity were appropriately predicted through optimization of MLP, but were limited to the experimental greenhouse. Therefore, it is necessary to collect more data from greenhouses at various places and modify the structure of neural network for generalization.



환경요인을 이용한 다층 퍼셉트론 기반 온실 내 기온 및 상대습도 예측

최 하영, 문 태원, 정 대호, 손 정익*
서울대학교 식물생산과학부

초록


    Ministry of Agriculture, Food and Rural Affairs
    717001-07-1-HD240

    서 론

    작물 생장은 환경에 영향을 많이 받기 때문에 수확량 을 증대하려면 적절한 환경조절이 필요하다. 특히 환경 요소 중 온도는 발아, 증산작용, 휴면, 꽃눈 분화, 개화, 생장 및 성숙 등 다양한 화학 반응 및 발달 과정에 관 여하며, 기온이 작물의 생육 적온 보다 높거나 낮을 경 우 생장이 저해되고 심한 경우에는 작물이 죽을 수도 있다(Went, 1953). 상대습도의 경우 적정 범위를 벗어날 경우 기공폐쇄, 낙엽, 낙과 등의 생리 장애를 일으키거 나, 병충해가 발생할 확률을 높인다(Grange와 Hand, 1987). 온실 재배의 경우, 온실이 완전히 외부와 격리된 것이 아니며 외부 환경이 내부 환경에 영향을 미치기 때문에 최적화된 기온 및 상대습도를 유지하는 것은 어 려운 일이다. 이런 환경 요인들을 적절하게 제어하지 못 할 경우 식물체 표면에 결로 현상이 일어나 병해충을 유발시켜서 생산량을 크게 떨어뜨릴 수 있으며, 온실 표 면에 결로가 발생할 경우 광 투과율을 떨어뜨린다(Arauz 와 Sutton, 1990;Pieters 등, 1997).

    따라서 앞으로의 환경이 어떻게 변화하는지 예측하는 것은 정확한 환경조절을 위한 방법이 될 수 있다. 과거 연구에서는 외부 광도, 온도, 환기 열 손실 등 다양한 환 경 요인들의 물리적 특성을 고려한 수학적 모델을 만들 어 온실 내 기온을 예측하였다(Walker, 1965;Froehlich 등, 1979;Chandra 등, 1981). 상대습도 역시 유사한 방 식으로 외부 환경 요인을 이용해 온실 내부 상대 습도 를 예측하는 수학적 모델이 개발되었다(Jolliet, 1994). 그러나 수학적 모델들은 더 높은 정확도를 확보하기 위 해 변수 및 파라미터들이 증가시켜 모델의 형태와 구조 가 복잡해질 수 있으며, 최근에는 3차원 상에서의 시뮬 레이션을 활용하여 복잡한 예측 모델을 구성하는 연구들 이 등장하고 있다(Hong and Lee, 2014;Lee 등, 2014).

    90년대 이후로 변수 간 관계를 스스로 학습할 수 있는 인공신경망을 온실 환경 예측에 사용하는 연구들이 등장 했다. 인공신경망의 한 종류인 다층 퍼셉트론(multilayer perceptrons, MLP)은 다양하게 얻어진 빅데이터를 이용 해서 비선형 구조를 나타낼 수 있는 모형이 필요 없는 방법으로 특정한 규칙이 없이 오로지 데이터로부터 학습 할 수 있다. 따라서 기존 통계 분석과 달리 MLP는 데이 터 분석에 있어서 데이터 간 연관성 분석에 대한 통찰과 노력이 덜 필요하며, MLP의 일반적인 구조만 설정하면 되기 때문에 요소 간의 관계에 대해서 분석하는데 드는 비용이 감소한다(Benediktsson 등, 1990;Seginer, 1997). 기존 연구에서도 인공신경망을 이용해서 온실 내 기온, 상대습도, CO2 농도에 대해서 각각 예측한 적이 있으며 (Ferreira 등, 2002;He와 Ma, 2010;Moon 등, 2018), 독립적인 모델인 아닌 기존의 온실 환경 예측에 사용되 는 모델의 일부를 인공신경망으로 대체하여 환경 요인의 예측을 시도한 연구 들도 있었다(Seginer, 1997). 그러나 기존 연구들은 동일 시점의 다른 환경 요소들을 이용하 여 동일 시점의 기온 및 상대습도를 추정하며 일정 시 간 미래의 기온 및 상대습도를 예측할 수 없었다.

    본 연구에서는 MLP를 이용해서 특정 시점의 환경 데 이터를 이용하여 그 시점 이후의 온실 내 기온과 상대습 도를 직접 예측하고, 실제 시스템을 구현할 때 주로 사용 하는 통계적 기법인 다중선형회귀분석(multiple linear regression, MLR)과 성능을 비교했다.

    재료 및 방법

    1. 재배 조건

    실험은 어윈 망고(Mangifera indica cv. Irwin)를 재배 중인 보령에 있는 8연동 플라스틱 필름 온실 (폭 34.4m, 길이 30m, 측고 4.5m, 동고 5.7m, 총 면적 1,032m2, 남 북동)에서 이루어졌다. 어윈 망고는 2015년 8월 9일에 2 년생 묘목을 대형 플라스틱 포트(내경 76cm, 높이 47cm)에 정식하여, 재식 간격 2.5m (재식밀도 6.25m2)로 배치하였다. 어윈 망고의 영양생장을 촉진하고 수형을 갖추기 위해서 주기적으로 유인 및 정지작업을 실시하였 다. 연구용 온실은 개별 환경 제어가 가능한 3개의 구역 으로 구성되어 있고, 작물 생산에 유리하도록 광 투과율 (92%)이 높은 두께 0.15mm PO 필름을 온실 피복재로 이용하였다. 온실 내부 온도는 발전소 온배수를 주 열원 으로 사용하는 3개의 히트펌프와 천창 및 측창을 통한 환기로 조절되었다. 온실 내부 천창 측에 차광을 위해서 차광효율이 12%인 산광 스크린을 설치했고, 겨울철 보 온을 위해서 보온 20%, 차광 52%인 알루미늄 스크린을 설치했으며, 온실 측면에는 보온을 위해서 보온 70%, 차광 98%인 알루미늄 스크린을 설치했다. 환기장치, 차 광 및 보온 스크린, 관수시스템, CO2 공급 시스템은 환 경 복합 센서 디바이스 및 CCTV와 실시간으로 연동하 여 관련 정보를 모니터링, 수집 및 제어를 할 수 있는 시험용 IoT 플랫폼을 구성하고 있다. 온실에서 다양한 실험이 진행되었기 때문에 환경 제어 설정 값은 구역 간에 0.5~1°C 정도 차이가 있었다. 일반적으로 온도 제 어는 온실 내 온도를 26°C 이상으로 유지시키기 위해 설정되었고, 2016년 12월 29일부터 2017년 3월 23일까 지는 생식 생장 단계로 돌입하기 위해서 히트펌프 설정 값을 10°C까지 낮추었다.

    2. 데이터 수집 및 전처리

    환경데이터는 온실 내부에 설치된 9개 복합 센서 (Korea Electronics Technology Institute, Korea)로 측정 한 기온, 상대습도, CO2 농도, 대기압, 조도와 보령 기상 대의 온실 외부의 기온, 상대습도, 풍향, 풍속, 대기압, 강우 데이터를 사용했다(Table 1). 또한 예측 성능 향상 을 위해서 천창, 측창, 보온커튼, 차광커튼의 개폐, 관수, 히트펌프 설정 온도를 추가적으로 사용했다. 모든 데이 터는 10분 간격으로 2016년 10월 1일부터 2018년 2월 28일까지 측정되었다. 2016년 10월 5일부터 7일까지 기 온과 CO2 농도의 보정용 자료를 얻기 위해서 야간에는 가온을 하지 않았기 때문에 측정 데이터에서 제외했다. 측정 시간 데이터는 계절이 순환하는 속성을 반영하기 위해서 삼각함수를 이용하여 1년 단위로 주기성을 띄게 하였다. 측정 데이터들에서 센서의 오류나 꺼짐으로 인하 여 데이터가 없는 부분은 인접한 데이터로부터 2개까지 의 데이터를 선형함수를 이용해서 보간을 했다. 여러 정 규화 방법 중 흔히 사용되고 정확도가 높은 편인 최대-최 소 평준화를 이용해서 0과 1사이로 정규화하여 인공신경 망을 학습하였다(Al Shalabi와 Shaaban, 2006). 총 61,801 데이터 셋이 기온 및 상대습도의 예측에 사용되었다.

    3. 다층 퍼셉트론(MLP)과 다중선형회귀분석(MLR)

    MLP는 인공신경망의 한 종류로, 입력층, 출력층, 그리 고 적어도 한 개 이상의 은닉층로 구성된 피드포워드망 (feed-forward network)이다. 신경망 모델은 Tensorflow (v. 1.8.0)라는 Python 언어 기반의 프레임워크를 이용하 여 구축하였다(Abadi 등, 2016). 입력층에는 학습에 들 어갈 입력 종류 수만큼의 노드가 있고, 출력층과 은닉층 에 있는 노드는 활성함수(activation function)를 포함한 다. 각 노드는 이전 층에서 입력 값을 받아 가중치를 곱 하고 활성 함수를 통해서 출력 값을 생성한다. 은닉층에 서 사용한 활성함수는 신경망 모델에서 주로 사용되는 함 수인 수정된 선형 함수(rectified linear unit, ReLU)가 사용 되었고(Eq. 1), 출력층에서는 선형 회귀(linear regression) 를 위해 항등함수[f(x) = x]를 활성함수로 이용하였다. ReLU는 다층 구조에서 기존 활성함수 중에서 학습 속도 가 빠르다고 알려져 있으며 다음과 같은 형태이다 (Glorot, 2011).

    f ( x ) = max ( 0 , x )
    (1)

    모델 검증을 위해 61,801개의 데이터 셋을 학습, 평가, 시험 세트로 분류했다. 사계절이 뚜렷한 한국 내에서 계 절별 환경 차이에 따른 신경망 성능을 비교하기 위해서 겨울(2017년 1월 25~27일), 봄(2017년 4월 27~29일), 여름(2017년 7월 28~30일), 가을(2017년 10월 28~30일) 에 해당하는 3일치 데이터를 시험 데이터 세트(1,706)로 이용했고, 남은 데이터 세트(60,095)는 무작위로 70%를 학습(42,066), 30%를 평가(18,029)로 나누어서 모델 학습 을 진행했다. 모델 학습은 AdamOptimizer를 이용해서 예 측값과 실측값의 평균제곱근오차(root mean square error, RMSE)를 최소화하는 방법으로 수행되었다(Kingma와 Ba, 2014). MLP와 AdamOptimizer의 파라미터는 보편적 으로 사용되는 값을 이용했다(Table 2). 학습 속도를 증가 시키고 과적합을 방지하기 위해서 배치 정규화(batchnormalization) 를 이용하였다(Ioffe와 Szegedy, 2015). 이때 결정계수(R2)를 모델 정확도의 척도로 사용했다. 마지막 으로 최적 모델을 찾기 위해 10분 후 기온 및 상대습도 예측에 대해서 각각 45개의 은닉층과 노드의 조합을 이 용하여 학습을 진행하여 제일 높은 정확도를 갖는 구조 로 최적화를 하였고 이를 이용해 입력 데이터의 시점으 로부터 10분 단위로 10~120분 후의 기온과 상대습도를 학습하여 예측하였다.

    MLR의 성능을 평가하기 위해서 동일한 학습 데이터 세트을 이용해 다중회귀분석모형의 회귀 계수를 추정하 고, 만들어진 다중선형회귀모형을 시험 세트에 적용하여 결정계수 및 평균제곱근오차를 구했다.

    y = Σ a i x i + b
    (2)

    다중선형회귀식을 일반화하면 위 식과 같으며 y는 반 응변수, x는 설명변수, a는 회귀계수, i는 설명변수의 개 수, b는 오차이다. Python 언어 기반의 Sklearn 라이브 러리 내 최소제곱 추정 방식을 사용하여 회귀계수를 추 정했다(Pedregosa 등, 2011).

    결과 및 고찰

    1. 은닉층과 노드의 최적 개수

    상대습도 예측을 위한 최적 구조의 경우 은닉층이 4개, 노드 수가 64개일 때 R2가 0.99로 가장 높았고, 기온의 경우 은닉층과 노드 수가 각각 4개, 128개일 때 R2가 0.99로 가장 높았다(Table 3). 그러나 은닉층의 수와 노 드 수에 상관없이 0.98 이상의 R2를 보여주었고 모델 구조를 키우더라도 정확도가 거의 변하지 않았다. 가장 정확도가 높은 조합을 사용하여 학습을 진행할 때에 기 온은 약 15분, 상대습도는 약 10분이 소요되었다.

    최근에 구현된 딥러닝 알고리즘을 보면 이미지 처리, 음성 인식, 게임 승리 목표에 있어서 깊고 복잡한 구조 를 가진 높은 성능의 모델을 구성한다(Hinton 등, 2012;Krizhevsky 등, 2012;Mnih 등, 2013;He 등, 2016;Silver 등, 2016). 그러한 복잡한 구조를 구현하기 위해 서는 고성능 처리기가 필요하며, 장기간의 학습이 요구 된다. 그러나 본 실험에서는 비교적 간단하고 작은 구조 에서 최적화 되었고(Fig. 1), 노드 수가 특정 개수를 넘 어가면 정확도가 오히려 감소하였다. 시벤코(Cybenko) 정리에 따르면 다층 퍼셉트론은 활성 함수와 무관하게 유한한 노드 수를 갖는 은닉층 한 층으로도 모든 연속 적인 함수를 표현할 수 있다(Hornik 등, 1989;Hornik, 1991). 본 실험에서 온실 내 기온과 상대습도를 예측할 때 학습 구조가 작아도 높은 정확도를 확보한 것으로 보아 기온 및 상대습도와 환경 요소의 관계는 깊은 구 조를 사용할 정도로 복잡하지 않은 것으로 보이며, 그로 인해 기온 및 상대습도 예측에 필요한 비용이 적어 실 제 온실 제어에 적용되기 용이하다.

    한편, 온실 내 같은 시간대 CO2 농도를 예측하는 실 험에서는 은닉층 2개, 노드 256개에서 MLP가 제일 높 은 정확도를 보여주었으며(Moon 등, 2018), 은닉층 수 를 결정할 수 있는 다양한 방법론을 적용하여 재생 에 너지에 쓰이는 풍속을 예측하는 경우에는 은닉층 1개, 노드 39개로 모델을 최적화하였다(Sheela와 Deepa, 2013). 따라서 더 복잡한 구조를 사용했더라도 정확도가 좋아지지 않았을 수 있지만, 본 실험에서 사용한 MLP 도 노드와 은닉층의 수를 세밀히 조합하면 정확도가 더 높아질 수 있는 가능성이 있다. 그러나 학습된 MLP는 충분히 높은 정확도를 보여주고 있으므로 더 나은 정확 도를 확보할 필요가 없다고 말할 수 있다. 또한, 학습에 소요된 시간과 하드웨어의 메모리 사용량을 고려하면 최 대한 층이 적고 노드 수가 적을수록 용이하기 때문에 상황에 맞게 성능을 조절할 수 있을 것이다.

    2. 기온 및 상대습도의 예측

    10분 예측 결과를 계절 별로 확인하였을 때, MLP는 계절 변동이 큰 환경과 환경에 따라 달라지는 제어 때 문에 시간에 따라 다른 양상을 보임에도 적절히 기온과 상대습도를 예측하였다(Fig. 2). 실제로 여름철에는 야간 온도가 높기 때문에 히트펌프가 작동하지 않아 기온 및 상대습도가 진동하는 형태를 보이지 않지만, 여름철이 아닌 경우 야간에 히트펌프가 작동하면서 기온이 진동하 며, 이에 따라 온도에 영향을 받는 상대습도 역시 진동 하는 형태가 나타난다. 그럼에도 불구하고, 학습된 MLP 는 야간 기온과 상대습도의 진동 여부와 상관없이 R2 = 0.99로 높은 정확도로 예측하였다. 이후 같은 구조로 10 분에서 120분 후까지 예측을 진행했을 때에는 R2와 RMSE가 예측하고자 하는 시점이 예측하려는 시점과 멀 어질수록 점차 낮아지지만 다변량회귀 분석과 비교해서 상대적으로 정확도가 덜 감소했다(Fig. 3).

    환경은 고정적인 기후로 인해 어느 정도 규칙성을 가 지고 움직인다고 볼 수 있으나 환경 제어의 경우에는 온실 관리자의 판단에 따라서 변화하기 때문에 현재 가 지고 있는 데이터 투입 요소로는 먼 미래를 예측하기가 어렵다. 또한 본 연구에서의 MLP를 이용한 기온 및 상 대습도 예측은 예측 시점과 예측하려는 시점 사이의 비 정기 환경 제어 요소 값을 받을 수 없어서 실제로 예측 되는 것은 규칙적인 환경 제어 요소만 반영되었을 때의 기온 및 상대습도가 예측이 된다. 따라서 실제 상황에서 는 예측 시점이 멀어질수록 정확도가 떨어졌다고 보인다.

    대개 MLP는 시간에 의한 변화를 학습할 수 없고 입 력과 출력의 정적인 관계만을 학습할 수 있다(Haykin, 2009). 그러나 본 실험의 결과로 볼 때, 입력과 출력 사 이의 시간 간격이 좁을 경우 학습된 MLP가 높은 정확 도로 미래의 기온과 상대습도를 예측하였기 때문에, 가 까운 미래의 기온과 상대습도 예측이 가능하다고 할 수 있다. 또한 MLP를 사용한 기온 및 상대습도 예측이 전 체 구간에 대해 높은 정확도를 보여주었기 때문에, 온실 환경과 기온 및 상대습도에 대한 관계를 일반화했다고 볼 수 있다. 하지만 다변량 회귀분석 역시 입력과 출력 사이의 시간 간격이 좁을 경우 MLP와 비슷한 성능을 보이기 때문에 데이터가 부족하고 짧은 기간의 예측을 통한 제어 시스템일 경우에는 다변량 회귀분석이 더 유 용하게 쓰일 수 있다.

    MLP를 학습할 때 너무 큰 구조를 사용하거나 적은 데이터를 이용하여 학습을 많이 반복하게 되면 테스트 데이터에 대한 정확도는 떨어지고 학습에 사용한 데이터 만 정확히 맞추는 과적합이 일어난다(Tetko 등, 1995). 그러나, 학습된 MLP는 데이터를 적합하게 일반화하였기 때문에 각 계절의 반복이 포함된 2년 동안 수집된 데이 터를 사용하고, 모델 학습 시 배치 정규화을 사용하는 등 과적합을 방지할 수 있는 다양한 방법들이 효과가 있었다고 볼 수 있다. 결과적으로, 시스템이 잘 갖추어 져 있고 데이터가 어느 정도 축적된 온실이라면 장기적 으로는 MLP가 다변량 회귀분석보다 유용하며, 특히 더 먼 미래를 예측할 필요가 있을 경우에는 두드러지게 드 러난다.

    3. 관수 여부에 따른 예측 분석

    MLP가 대부분의 데이터에 대해 일반화하여 높은 예 측 정확도를 보여주었으나, 상대습도의 예측값과 측정값 을 비교했을 때 측정한 상대습도 91%를 61%로 과소평 가한 경우가 존재하였다. 이는 센서의 오류 등이 아닌 정상적인 상황으로 볼 수 있음에도 학습된 MLP는 이 특정 시점에 대한 상대습도 예측에 있어 큰 오차를 보 이고 있다. 그러나 관수로 인하여 상대습도가 급격하게 90% 이상으로 상승하고 난 이후 시점으로는 학습된 MLP는 상대습도를 예측할 수 있었다(Fig. 2D). 그러나 예측 시점이 멀어질수록 관수에 의한 상대습도 예측 정 확도가 감소하였으며, 예측 데이터 전체의 정확도 역시 예측 시점이 입력에서부터 멀어질수록 전체적으로 감소 하였다(Fig. 3D). 기온의 최소 정확도는 110분 뒤를 예 측하는 경우에서 R2 = 0.94, 상대습도의 최소 정확도는 120분 뒤를 예측하는 경우에서 R2 = 0.90이었다.

    91%를 61%로 과소평가한 이상점은 10분 전에 진행한 분무 관수로 인하여 실제로는 상대습도가 증가했지만 학 습된 MLP는 제대로 예측하지 못해서 발생했다. 딥러닝 방법 중 하나인 MLP는 사용자가 입력값의 특징을 추출 할 필요 없이 측정 데이터로부터 구조적으로 예측 및 분 류에 필요한 특징을 자동화하여 발견할 수 있다(LeCun 등, 2015). 그러나, 학습된 MLP는 은닉층이 4개로, 일반 적으로 매우 깊은 구조를 사용하는 다른 MLP보다 측정 데이터에서 특징을 추출하고 추상화하는 능력이 약할 것 으로 예상할 수 있다. 본 실험에서 사용된 MLP의 구조 상 분무 관수 데이터나 직접적으로 분무 관수와 관련된 데이터가 현재 데이터에 포함되지 않으면 예측이 어려운 것으로 보인다. 본 실험에서는 숙지하고 기존 점적 관수 외에도 분무 관수 데이터를 추가했지만, 데이터 수집 기 간 중 매우 드물고 불규칙적으로 수행되었기 때문에 학 습에 영향을 끼치지 못한 것이 더 큰 요인이라고 보인다. 따라서 추후 재배 시 관수 방식을 통일하거나 분무 관수 가 행해진 데이터를 더 많이 확보한다면 상대습도 예측 에 대한 정확도를 높일 수 있을 것이다.

    기온 및 상대습도에 대한 예측 시기가 멀어질수록 정 확도가 감소하는데, 가장 급격한 변화를 보이는 분무 관 수 시기의 상대 습도를 보면 확연한 차이를 볼 수 있다 (Fig. 2D). 기온 역시 분무 관수에 의해 3°C 가량 떨어 지는 것을 확인할 수 있고, 상대습도와 유사하게 잘못된 예측 패턴을 보이지만 변화량이 적어서 정확도에는 큰 영향을 주지 않았다. MLP 구조 상 입력과 출력 사이 기간의 데이터를 사용한 것이 아니기 때문에 그 간격에 서 급격하게 변하는 환경과 제어에 대한 정보를 추정할 수 없다. 그래서 예측시기가 늦어질수록 급격한 변화에 대한 예측이 떨어질 수밖에 없지만, 분무 관수 이후 급 격한 상대습도 상승은 예측하지 못하지만 그 이후 높은 상대습도를 어느 정도 예측하는 것으로 보아서 학습된 MLP가 그 전 시점 데이터 중 상대습도 데이터를 예측 에 많이 반영한다고 여겨진다.

    4. 한계 및 발전 방향

    본 실험에서 사용한 통합 센서는 전자부품연구원에서 개발되었지만 아직 산업화되지 않는 센서이다. 따라서 통신 오류로 인한 데이터 손실이 있었다. 기계 학습이나 통계 모델에서는 사용하는 데이터가 명확하고 노이즈가 적을수록 더 견고한 모델을 얻을 수 있다(Tweedie, 1994). MLP를 이용하여 불완전한 데이터가 섞여 있는 데이터 셋으로도 충분히 높은 정확도를 확보할 수 있었 으나, 이후 실험에서 더 완전한 데이터를 모델 학습에 이용한다면 더 높은 정확도를 기대할 수 있을 것이다. 또한 본 실험에서 학습된 모델은 보령에 위치한 온실 재배 조건 및 한 작물 작기 도중에 최적화가 되었다. 따 라서 다른 지역에서 이 모델을 그대로 사용하거나 새롭 게 짓는 온실에서 적용, 또는 다른 생장 단계의 작물을 온실 내에 기른다면 충분한 정확도를 보장할 수 없다 (Seginer, 1997). 추후 다양한 장소의 온실에서의 환경 데이터를 수집하고 내부 재배 작물에 대한 정보를 함께 학습한다면 보편적인 온실 환경 예측 모델을 구성할 수 있을 것이다.

    한편 MLP는 데이터의 시간적 연속성을 고려하지 않 고 입력 데이터와 출력 데이터 간의 관계만을 학습한다. 따라서 예측 시기가 입력데이터로부터 멀어질수록 입력 데이터와 출력 데이터 간의 관련성이 떨어지고, 그 사이 에 관여하는 환경과 제어 요소를 정확히 알 수 없기 때 문에 정확도가 떨어진다. 딥러닝 방법론 중 하나인 순환 신경망(recurrent neural network, RNN)은 입력되는 값 들의 순서를 파악할 수 있어서 순서가 중요한 데이터에 서 패턴을 예측하는데 유용한 신경망 구조 중 하나이다 (Hochreiter와 Schmidhuber, 1997). 따라서 이후 실험에 서 순환신경망 등 시간에 따른 누적 효과를 고려할 수 있는 모델을 사용한다면 예측 시점에 무관하게 높은 정 확도를 얻을 수 있을 것이다. 그러나, 본 실험에서 학습 된 MLP도 충분히 높은 정확도를 보여주었기 때문에 예 측에 기반하여 기온 및 상대습도를 제어하는 시스템에 적용할 수 있으며, 온실 내 결로 현상 등을 사전에 예측 하는데 도움이 될 수 있다.

    적 요

    온도와 상대습도는 작물 재배에 있어서 중요한 요소로 써, 수량과 품질의 증대를 위해서는 적절히 제어 되어야 한다. 그리고 정확한 환경 제어를 위해서는 환경이 어떻 게 변화할지 예측할 필요가 있다. 본 연구의 목적은 현 시점의 환경 데이터를 이용한 다층 퍼셉트론(multilayer perceptrons, MLP)을 기반으로 미래 시점의 기온 및 상 대습도를 예측하는 것이다. MLP 학습에 필요한 데이터 는 어윈 망고(Mangifera indica cv. Irwin)을 재배하는 8 연동 온실(1,032m2)에서 2016년 10월 1일부터 2018년 2 월 28일까지 10분 간격으로 수집되었다. MLP는 온실 내부 환경 데이터, 온실 외 기상 데이터, 온실 내 장치 의 설정 및 작동 값을 사용하여 10~120분 후 기온 및 상대습도를 예측하기 위한 학습을 진행하였다. 사계절이 뚜렷한 우리나라의 계절에 따른 예측 정확도를 분석하기 위해서 테스트 데이터로 계절별로 3일간의 데이터를 사 용했다. MLP는 기온의 경우 은닉층이 4개, 노드 수가 128개일 때(R2 = 0.988), 상대습도는 은닉층 4개, 노드 수 64개에서 가장 높은 정확도를 보였다(R2 = 0.990). MLP 특성상 예측 시점이 멀어질수록 정확도는 감소하 였지만, 계절에 따른 환경 변화에 무관하게 기온과 상대 습도를 적절히 예측하였다. 그러나 온실 내 환경 제어 요 소 중 분무 관수처럼 특이적인 데이터의 경우, 학습 데이 터 수가 적기 때문에 예측 정확도가 낮았다. 본 연구에서 는 MLP의 최적화를 통해서 기온 및 상대습도를 적절히 예측하였지만 실험에 사용된 온실에만 국한되었다. 따라 서 보다 일반화를 위해서 다양한 장소의 온실 데이터 이 용과 이에 따른 신경망 구조의 변형이 필요하다.

    추가 주제어: 기계학습, 딥러닝, 비모델 예측, 인공신경망

    사 사

    본 연구는 본 연구는 농림식품기술기획평가원에서 지 원하는 “스마트팜 연구센터(717001-07-1-HD240)”의 일 환으로 수행되었음.

    Figure

    KSBEC-28-2-95_F1.gif

    An optimized architecture of multilayer perceptron predicting relative humidity or air temperature at a future time T (10–120 min; every 10 min).

    KSBEC-28-2-95_F2.gif

    Comparison of 10-min future values of air temperature (AT) and relative humidity (RH) measured and estimated using the multilayer perceptron. A, B, C, and D represents winter (Jan. 25–27), spring (Apr. 27–9), summer (Jul. 28–30), and fall (Oct. 28–30), respectively.

    KSBEC-28-2-95_F3.gif

    Root mean square errors (RMSEs) and test accuracies (R2) when predicting air temperature (A and B) and relative humidity (C and D) by using multilayer perceptron algorithms (black bar) and linear regression (grey bar), respectively, at different future times.

    Table

    Ranges of the measured environment and control factors.

    Parameters for the multilayer perceptron and AdamOptimizer.

    Model accuracies (R2) of the multilayer perceptrons at different numbers of hidden layers and neurons when predicting 10-min future relative humidity (A) and air temperature (B).

    Reference

    1. Abadi, M. , P. Barham, J. Chen, Z. Chen, A. Davis, J. Dean, M. Devin, S. Ghemawat, G. Irving, M. Isard, et al. 2016. TensorFlow: A system for large-scale machine learning. In: Proceedings of 12th USENIX OSDI, November, Savanah, GA, USA, 265-283.
    2. Al Shalabi, L. and Z. Shaaban. 2006. Normalization as a preprocessing engine for data mining and the approach of preference matrix. In: Proceedings of 2006 International conference on Dependability of Computer Systems, May,Szklarska Poreba, Poland, IEEE, 207-214.
    3. Arauz, L. F. and T. B. Sutton. 1990. Effect of interrupted wetness periods on spore germination and apple infection by Botryosphaeria obtusa. Phytopathol. 80:1218-1220.
    4. Benediktsson, J.A. , P.H. Swain, and O.K. Ersoy. 1990. Neural network approaches versus statistical methods in classification of multisource remote sensing data. In: Proceedings of Transactions on Geoscience and Remote Sensing, July, Vancouver, Canada, IEEE, 540-552.
    5. Chandra, P. , L.D. Albright, and N.R. Scott. 1981. A time dependent analysis of greenhouse thermal environment. Trans. ASAE 24:442-449.
    6. Ferreira, P.M. , E.A. Faria, and A.E. Ruano. 2002. Neural network models in greenhouse air temperature prediction. Neurocomputing 43:51-75.
    7. Froehlich, D.P. , L.D. Albright, N.R. Scott, and P. Chandra. 1979. Steady-periodic analysis of glasshouse thermal environment. Trans. ASAE 22:387-399.
    8. Glorot, X. , A. Bordes, and Y. Bengio. 2011. Deep sparse rectifier neural networks. In: Proceedings of the 14th International conference on Artificial Intelligence and Statistics, April, Ft. Lauderdale, FL, USA, 315-323.
    9. Grange, R.I. and D.W. Hand. 1987. A review of the effects of atmospheric humidity on the growth of horticultural crops. J. Hortic. Sci. 62:125-134.
    10. Haykin, S . 2009. Neural networks: a comprehensive foundation. 3st ed. Prentice Hall PTR, Upper Saddle River, NJ, USA. p. 122-129.
    11. He, F. and C. Ma. 2010. Modeling greenhouse air humidity by means of artificial neural network and principal component analysis. Comput. Electron. Agric. 71:S19-S23.
    12. He, K. , X. Zhang, S. Ren, and J. Sun. 2016. Deep residual learning for image recognition. In: Proceedings of the IEEE conference on Computer Vision and Pattern Recognition, June, Las Vegas, NV, USA, IEEE, 770-778.
    13. Hinton, G. , L. Deng, D. Yu, G.E. Dahl, A.R. Mohamed, N. Jaitly, A. Senior, V. Vanhouckeet, P. Nguyen, T.N. Sainath, et al. 2012. Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups. IEEE Signal Proc. Mag. 29:82-97.
    14. Hochreiter, S. and J. Schmidhuber. 1997. Long short-term memory. Neural Comput. 9:1735-1780.
    15. Hong, S.W. and I.B. Lee. 2014. Predictive model of microenvironment in a naturally ventilated greenhouse for a model-based control approach. Protected Hort. Plant Fac. 23:181-191.
    16. Hornik, K. , M. Stinchcombe, and H. White. 1989. Multilayer feedforward networks are universal approximators. Neural Networks 2:359-366.
    17. Hornik, K . 1991. Approximation capabilities of multilayer feedforward networks. Neural Networks 4:251-257.
    18. Ioffe, S. and C. Szegedy. 2015. Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv preprint arXiv:1502.03167.
    19. Jolliet, O . 1994. HORTITRANS, a model for predicting and optimizing humidity and transpiration in greenhouses. J. Agr. Eng. Res. 57:23-37.
    20. Kingma, D. and J. Ba. 2014. Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980v9.
    21. Krizhevsky, A. , I. Sutskever, and G.E. Hinton. 2012. Imagenet classification with deep convolutional neural networks. In: Proceedings of Advances in Neural Information Processing Systems, December, Lake Tahoe, NV, USA, 1097-1105.
    22. LeCun, Y. , Y. Bengio, and G. Hinton. 2015. Deep learning. Nature 521:436.
    23. Lee, J.W. , J.H. Shin., J.H. Kim., H.W. Park, I.H. Yu., and J.E. Son. 2014. Analysis of light environments in reclaimed land and estimation of spatial light distributions in greenhouse by 3-D model. Protected Hort. Plant Fac. 23:303-308.
    24. Mnih, V. , K. Kavukcuoglu, D. Silver, A. Graves, I. Antonoglou, D. Wierstra, and M. Riedmiller. 2013. Playing atari with deep reinforcement learning. arXiv preprint arXiv:1312.5602.
    25. Moon, T.W. , D.H. Jung, S.H. Chang, and J.E. Son. 2018. Estimation of greenhouse CO2 concentration via an artificial neural network that uses environmental factors. Hortic. Environ. Biotechnol. 59:45-50.
    26. Pedregosa, F. , G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, et al. 2011. Scikit-learn: Machine learning in python. JMLR. 12:2825-2830
    27. Pieters, J. G. , J. M. Deltour, and M. J. Debruyckere. 1997. Light transmission through condensation on glass and polyethylene. Agric. Forest Meteorol. 85:51-62.
    28. Seginer, I . 1997. Some artificial neural network applications to greenhouse environmental control. Comput. Electron. Agric. 18:167-186.
    29. Sheela, K.G. and S.N. Deepa. 2013. Review on methods to fix number of hidden neurons in neural networks. Math. Probl. Eng. 2013:11.
    30. Silver, D. , A. Huang, C.J. Maddison, A. Guez, L. Sifre, G. Van Den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, et al. 2016. Mastering the game of Go with deep neural networks and tree search. Nature 529:484-489.
    31. Tweedie, R. L. , K.L. Mengersen, and J.A. Eccleston. 1994. Garbage in, garbage out: can statisticians quantify the effects of poor data?. Chance 7:20-27.
    32. Walker, J.N . 1965. Predicting temperatures in ventilated greenhouses. Trans. ASAE 8:445-448.
    33. Went, F.W . 1953. The effect of temperature on plant growth. Annu. Rev. Plant Physiol. 4:347-362.