Journal Search Engine

Download PDF Export Citation Korean Bibliography
ISSN : 1226-9999(Print)
ISSN : 2287-7851(Online)
Korean J. Environ. Biol. Vol.43 No.4 pp.537-550
DOI : https://doi.org/10.11626/KJEB.2025.43.4.537

Research trends in ecological restoration technologies using BERTopic (1992-2024)

Hyunjin Seo, Goeun Kim, Giyoung Ock*
Ecological Technology Research Team, Division of Restoration Ecology Research, National Institute of Ecology, Seocheon 33657, Republic of Korea
*Corresponding author Giyoung Ock Tel. 041-950-5625 E-mail. ockgy@nie.re.kr

Contribution to Environmental Biology


▪ This study presents the first comprehensive analysis of global ecological restoration research trends using BERTopic, identifying 22 key research topics across seven major categories.


▪ The findings provide valuable insights for environmental biologists by highlighting emerging restoration technologies, such as nature-based solutions and microbial applications.


▪ Additionally, the study reveals Korea’s significant contribution as the third most productive country in this field.


03/12/2025 16/12/2025 22/12/2025

Abstract


Ecological restoration has become a vital strategy for tackling global environmental challenges. This study utilized BERTopic, a neural network-based topic modeling technique, to analyze research trends in ecological restoration technologies across 9,557 academic papers published between 1992 and 2024. Seven major research categories were identified: soil remediation, water quality improvement, habitat and biodiversity restoration, nature-based solutions, seed-based restoration, contaminated site restoration, and wildfire management. The compound annual growth rate analysis revealed that nature-based solutions had the highest growth rate, followed by soil remediation and seed-based restoration. Keyword co-occurrence network analysis identified three major clusters: Nature-based Solutions, Soil & Microbial, and Water Quality, with nature-based solutions acting as the central hub connecting various research themes. Country-level analysis indicated that China led global research output, followed by the USA, while South Korea ranked third, particularly excelling in soil remediation and water quality improvement. The iterative BERTopic approach effectively separated ecological restoration studies from biomedical research that shares similar terminology, addressing the limitations of traditional keyword-based analyses. These findings shed light on the evolution and regional characteristics of ecological restoration research, providing valuable insights for future research priorities and policy development.



BERTopic을 활용한 생태복원 기술 연구 동향 (1992~2024) 분석

서현진, 김고은, 옥기영*
국립생태원 복원생태연구실 생태신기술팀

초록


    1. 서 론

    생태복원 (ecological restoration)은 훼손되거나 파괴된 생태계를 복구하여 생태적 기능과 서비스를 회복시키는 과정으로 전 세계적인 환경 문제 해결을 위한 핵심 전략으로 부상하고 있다 (Gann et al. 2019). 생태복원에 대한 관심은 1980년대부터 높아지기 시작하여 1987년 국제생태복원학회 (Society for Ecological Restoration, SER)가 설립되었으나, 이 시기의 연구는 개별 현장 중심으로 이루어져 체계적인 이론과 방법론의 정립이 필요한 단계였다 (Clewell and Aronson 2013). 1992년 리우 지구정상회의에서 생물다양성협약 (CBD)이 채택되고, 이듬해 생태복원 분야 최초의 학술 저널인 Restoration Ecology가 창간되면서 생태복원은 독립적인 학문 분야로 정립되기 시작하였다 (Clewell and Aronson 2013). 이후 연구 주제는 토양 복원, 수질 개선, 서식지 복원, 자연기반해법 (Nature-based Solutions, NbS) 등으로 다양화되었으며 (Cohen-Shacham et al. 2016;Shen et al. 2023), UN이 2021년부터 2030년까지를 ‘생태계 복원 10년 (UN Decade on Ecosystem Restoration)’ 으로 선포하면서 그 중요성이 더욱 강조되고 있다 (FAO et al. 2021;UNEP 2021). 이처럼 연구가 양적으로 팽창하고 분야가 다변화됨에 따라, 연구 동향을 체계적으로 파악하는 것이 정책 수립과 연구 우선순위 설정에 필수적이다.

    이러한 연구 동향을 파악하기 위해 전통적으로 계량서지학적 분석 (bibliometric analysis)이 활용되어 왔다 (Shen et al. 2023). 이 방법은 인용 네트워크, 공저자 관계, 키워드 동시출현 등을 통해 연구 흐름을 파악하는 데 유용하지만, 사전 정의된 키워드에 의존하기 때문에 대량의 문헌에서 잠재된 주제 구조를 자동으로 추출하는 데 한계가 있다 (Romero-Silva and De Leeuw 2021). 이를 극복하기 위해 토픽 모델링 기법이 도입되었으며, 대표적으로 LDA (Latent Dirichlet Allocation)가 널리 사용되어 왔다 (Blei et al. 2003). 그러나 LDA는 단어의 빈도에 기반한 bag-ofwords 가정을 따르므로 단어의 순서나 문맥적 의미를 충분히 반영하지 못하는 한계가 있다 (Wallach 2006).

    최근 자연어처리 (Natural language processing, NLP) 분야에서는 사전훈련 언어모델의 발전으로 이러한 한계를 극복할 수 있게 되었다. BERTopic (Bidirectional Encoder Representations from Transformers Topic Modeling)은 BERT 기반 문장 임베딩과 밀도 기반 클러스터링 (Hierarchical Density-Based Spatial Clustering of Applications with Noise, HDBSCAN), 차원 축소 기법 (Uniform Manifold Approximation and Projection, UMAP)을 결합한 토픽 모델링 기법으로 (Grootendorst 2022), 문헌의 의미론적 유사성을 기반으로 분류를 수행하기 때문에 동일한 단어가 다른 문맥에서 사용되는 경우에도 이를 구분할 수 있다. Egger and Yu (2022)는 BERTopic을 기존의 확률 기반 토픽 모델링 기법과 비교 분석하여 BERTopic이 짧은 텍스트에서 더 일관성 있는 토픽을 도출함을 확인하였다. 또한, BERTopic은 다양한 학문 분야에서 연구 동향 분석에 활용되고 있다. Han and Zhou (2024)는 해양학 분야의 30년간 연구 동향을 분석하여 주요 연구 주제와 신흥 토픽을 도출하였으며, Li et al. (2025)은 초지 황폐화 관련 문헌 4,504편을 분석하여 생태복원 및 생물다양성 보전 등 핵심 연구 주제를 규명하였다.

    따라서 본 연구에서는 BERTopic을 활용하여 1992년부터 2024년까지 발표된 생태복원 기술 관련 학술논문의 연구 동향을 분석하였다. 생태복원 기술 연구의 주요 주제 영역을 도출하고, 시간에 따른 연구 주제의 변화 추이와 국가별 연구 분포를 분석하여 분야의 발전 양상과 지역적 특성을 파악하고자 하였다.

    2. 재료 및 방법

    2.1. 데이터 수집

    본 연구에서는 PubMed 데이터베이스를 이용하여 생태 복원 기술 관련 학술논문을 수집하였다. PubMed는 생명과학 및 의생명 분야에 특화된 데이터베이스로, 생물정화 (bioremediation), 미생물 활용, 식물정화 (phytoremediation) 등 생물학적 복원 기술 연구가 체계적으로 수록되어 있어 생태복원 기술 동향 분석에 적합하다 (AlRyalat et al. 2019). 또한 MeSH (Medical Subject Headings) 기반의 체계적인 키워드 구조를 갖추고 있어 기술 관련 용어의 일관된 검색이 가능하다.

    검색어는 생태복원 일반, 생태모방 복원, 자연기반해법, 생태공학 등 4개 범주, 총 11개 키워드로 구성하였다 (Table 1). Entrez API를 활용하여 논문의 PMID, 제목, 초록, 발행 연도, 저널명, 저자 소속 국가 등의 서지정보를 추출하였으며, 분석 기간은 생태복원이 국제적 의제로 부상하고 학문적으로 체계화되기 시작한 1992년부터 2024년까지로 설정하였다. 초록이 없거나 발행연도가 누락된 논문, 중복 논문을 제외하여 총 16,439편의 논문이 수집되었다.

    2.2. BERTopic 분석

    분석 대상은 수집된 논문의 초록 (abstract)을 활용하였고, 특수문자 제거와 소문자 변환 등의 전처리를 수행하였다. 문장 임베딩을 위해서는 Sentence-BERT 모델 (all- MiniLM-L6-v2)을 사용하였다 (Reimers and Gurevych 2019). Sentence-BERT는 문장 전체의 의미를 수치화된 벡터로 변환하는 모델로, 본 연구에서는 각 논문 초록을 384 차원의 벡터로 변환하였다. 이를 통해 단순히 동일한 단어가 포함되었는지가 아니라 문장이 담고 있는 의미적 유사성을 기반으로 문헌을 비교할 수 있다. 이러한 특성은 생태 복원 분야처럼 ‘restoration’, ‘remediation’ 등의 용어가 토양, 수질, 서식지 등 다양한 맥락에서 사용되는 경우 각각을 구분하여 분석하는 데 유리하다.

    BERTopic은 이러한 BERT 기반 문장 임베딩과 클러스터링을 결합한 토픽 모델링 기법으로, 기존 LDA와 달리 단어의 문맥적 의미를 반영하여 분류를 수행한다 (Grootendorst 2022). BERTopic 분석은 다음의 5단계로 수행하였다. 첫째, Sentence-BERT를 이용하여 각 문헌을 384차원의 벡터로 변환하였다. 둘째, UMAP을 이용하여 고차원 데이터를 저차원으로 축소하였다 (McInnes et al. 2018). 고차원 임베딩에서는 군집화 성능이 저하되기 때문에, 본 연구에서는 384차원을 5차원으로 축소하였다 (Allaoui et al. 2020). UMAP은 원본 데이터의 국소적 (local) 및 전역적 (global) 구조를 모두 보존하면서 차원을 축소하기 때문에 유사한 연구 주제끼리 가깝게 배치되어 후속 클러스터링의 정확도를 높일 수 있다. 셋째, HDBSCAN 이용하여 유사한 문헌들을 그룹화하였다 (Campello et al. 2015). HDBSCAN 은 밀도 기반 군집화 알고리즘으로, 사전에 클러스터 수를 지정하지 않아도 데이터의 분포에 따라 최적의 토픽 수를 자동으로 결정하며, 어느 토픽에도 명확히 속하지 않는 문헌은 미분류 (outlier)로 처리하여 무리한 분류를 방지한다. 이러한 특성은 연구 영역의 경계가 유동적이고 새로운 분야가 지속적으로 등장하는 생태복원 분야의 분석에 적합하다. 넷째, c-TF-IDF를 이용하여 각 토픽의 대표 키워드를 추출하였다 (Grootendorst 2022). c-TF-IDF는 일반적인 TF-IDF (Term Frequency-Inverse Document Frequency) 와 달리 토픽 단위로 단어 중요도를 계산하기 때문에 해당 토픽을 다른 토픽과 구분짓는 핵심 용어를 효과적으로 도출할 수 있다. 이를 통해 토양 복원에서의 ‘biochar’, ‘microbial’, 수질 개선에서의 ‘constructed wetland’, ‘nitrogen removal’ 등 각 기술 분야의 핵심 용어를 식별할 수 있다. 다섯째, 모델 최적화를 위해 하이퍼 파라미터 자동 탐색 프레임워크인 Optuna (Akiba et al. 2019)를 사용하여 UMAP과 HDBSCAN의 주요 파라미터를 탐색하였으며, 미분류 비율을 최소화하는 방향으로 최적값 (min_topic_size=83)을 설정하였다.

    2.3. 토픽 분류 및 명명

    BERTopic 분석은 총 4차에 걸쳐 6회 반복 수행하였으며, 초기 분석에서 지나치게 포괄적인 토픽이나 다수의 미분류 문헌이 발생한 경우 해당 문헌들을 대상으로 재분석을 수행하였다. 각 차수에서 도출된 토픽은 대표 키워드와 해당 문헌의 초록 (3편)을 검토하여 생태복원 기술과의 관련성을 파악하였으며, 관련성이 낮은 토픽 (예: 순수 의학 연구, 농업 생산성 연구 등)은 제외하고, 주제가 모호하거나 과도하게 큰 토픽은 재분석 대상으로 분류하였다. 이러한 반복적 분석과 검토를 통해 생태복원 기술과 관련된 세부 토픽을 도출하였으며, 도출된 토픽은 주제적 유사성에 기반하여 하위범주와 대분류로 수동 분류하였다.

    2.4. 연구 동향 및 국가별 분석

    각 토픽별 연구 성장 추세를 정량적으로 비교하기 위해 연평균성장률 (Compound Annual Growth Rate, CAGR)을 산출하였다 (Wang et al. 2022). CAGR은 Eq. 1을 사용하여 계산하였으며, 분석 기간은 최근 10년 (2015~2024년)으로 설정하였다.

    C A G R = V f i n a l V i n i t i a l 1 n 1
    (Eq. 1)

    여기서 Vfinal은 최종년도 논문 수, Vinitial은 시작년도 논문 수, n은 분석 기간 연수이다.

    키워드 동시출현 네트워크 분석을 위해 최종 분류된 논문의 저자 키워드 (author keywords)를 추출하였다. BER Topic 분석 결과와 기존 문헌을 참고하여 생태복원 핵심 키워드 21개를 선정하고, 동일 논문 내 키워드 쌍의 동시 출현 빈도를 계산하였다. 선정된 키워드는 Nature-based Solutions (8개: nature-based solutions, ecosystem services, climate change, biodiversity, conservation, ecological restoration, green infrastructure, restoration), Soil & Microbial (8개: heavy metals, phytoremediation, biochar, soil remediation, microbial community, bioremediation, cadmium, adsorption), Water Quality (5개: water quality, constructed wetlands, nitrogen removal, wastewater treatment, eutrophication)의 3개 주제 클러스터로 분류하였다. 네트워크 시각화에는 Python의 NetworkX 라이브러리를 활용하였으며, 노드 크기는 동시출현 빈도 합계에 비례하도록 설정하였다.

    국가별 분석을 위해 논문 수집 시 주저자 (first author)의 소속 기관 정보에서 국가 정보를 추출하였다. 국가명은 소속 기관 주소의 국가 필드를 기준으로 하였으며, 국가명이 누락된 경우 기관명과 주소 정보를 바탕으로 수동 보완하였다. 국가 정보가 확인되지 않거나 ‘Unknown’으로 분류된 논문은 국가별 분석에서 제외하였다. 이를 바탕으로 대분류 주제별 국가별 논문 수 분포를 분석하여 지역적 연구 특성을 파악하였다. 국가별 분석은 생태복원 연구의 지리적 분포와 각국의 연구 우선순위를 파악하는 데 유용한 방법이다 (Guan et al. 2019;Wei et al. 2022;Shen et al. 2023).

    2.5. 분석 및 시각화 도구

    연도별 논문 수 변화, 주제별 비중 등의 시각화를 위해 Python의 matplotlib, seaborn 라이브러리를 활용하였으며, 토픽 간 계층적 관계는 BERTopic의 visualize_hierarchy 함수를 사용하여 분석하였다. 모든 분석은 Python 3.10 환경에서 BERTopic 0.16, sentence-transformers 2.2, UMAPlearn 0.5, HDBSCAN 0.8, Optuna 3.0을 사용하여 수행하였다.

    3. 결 과

    3.1. 연도별 논문 발표 추이

    1992년부터 2024년까지 생태계 복원 관련 연구는 지속적인 증가 추세를 보였다 (Fig. 1). 1992년 28편에서 시작하여 2023년 1,348편으로 약 48배 증가하였다. 특히 2015년 이후 급격한 증가세를 보이며, 2021년 유엔 생태계 복원의 10년 선포 전후로 연구 발표가 더욱 활발해진 것으로 나타났다.

    3.2. 토픽 분류 결과

    16,439편의 논문에 대한 초기 분석 결과 4개의 광범위한 주제가 도출되었다 (Fig. 2). Iteration 1에서 mice_liver (2,064편)와 teeth_dental (167편) 등 생의학 관련 주제는 제외되었으며, 가장 큰 주제 클러스터인 soil_ecological (14,157편)은 재분류를 실시하였다. 이후 Iteration 2에서는 생태복원 기술과 관련이 있는 7개 주제를 선택하였고 11개 주제는 제외되었으며, 미분류 문헌 (6,370편)과 광범위한 주제 (3,300편)는 각각 Iteration 3-1과 3-2로 분기되어 병렬로 재분류를 실시하였다. Iteration 4-1과 4-2까지 진행한 결과, 최종적으로 22개의 관련 주제 (9,557편, 58.1%)가 식별되었으며, 36개의 비관련 주제 (6,882편, 41.9%)는 제외되었다.

    도출된 22개 주제는 주제적 유사성에 기반하여 15개 하위범주와 7개 대분류로 수동 분류하였다 (Table 2, Fig. 3). 토양 정화 (Soil remediation)가 가장 큰 비중을 차지하였으며 (3,703편, 38.7%), 수질 개선 (Water quality improvement)이 그 뒤를 이었다 (3,109편, 32.5%). 기타 범주로는 서식지 및 생물다양성 복원 (1,454편, 15.2%), 자연기반해법 (606편, 6.3%), 종자 기반 복원 (327편, 3.4%), 오염부지 복원 (266편, 2.8%), 산불 관리 (92편, 1.0%)가 포함되었다.

    3.3. 연평균성장률 분석

    7개 대분류별 연평균성장률 (CAGR)을 분석한 결과 (Fig. 4), 자연기반해법 (NbS)이 22.8%로 가장 높은 성장률을 보였으며, 토양 복원 (21.4%), 종자 기반 복원 (20.1%), 서식지·생물다양성 (19.9%), 수질 개선 (18.6%)순이었다. 전체 평균 성장률은 19.7%로, 모든 분야에서 높은 성장세를 보였다. 반면, 산불 관리 (11.9%)와 오염지 복원 (7.6%)은 상대적으로 낮은 성장률을 보였다.

    3.4. 토픽 간 유사도 분석

    22개 세부 토픽 간 의미적 유사도를 코사인 유사도 기반 히트맵으로 분석한 결과 (Fig. 5), 토픽들이 대분류에 따라 명확히 클러스터링되는 양상을 보였다. 바이오차 관련 토픽들 (Biochar Adsorption, Biochar Soil Amendment)은 상호 유사도가 0.69로 나타났으며, 토양 정화 분야 토픽들과 연관성을 보였다. 특히 Biochar Adsorption은 Microbial Soil Remediation (0.89), Heavy Metal Contamination (0.85) 토픽과 높은 유사도를 보였다. 자연기반해법 관련 토픽들 (Urban NbS, Coastal Seagrass)은 서식지 복원 토픽들과 중간 정도의 유사도를 보여, 생태적 복원과 자연기반해법 간의 연계성을 시사하였다.

    3.5. 키워드 동시출현 네트워크 분석

    키워드 동시출현 네트워크 분석 결과 (Fig. 6), 21개 핵심 키워드가 106개의 연결로 구성된 네트워크를 형성하였으며, 생태복원 연구는 3개의 주요 클러스터로 구분되었다. Nature-based Solutions 클러스터에서 nature-based solutions는 ecosystem services (32회), climate change (26 회), green infrastructure (24회)와 강하게 연결되어 전체 네트워크의 중심 허브 역할을 하였다. 이는 NbS가 생태계 서비스 증진 및 기후변화 대응과 통합적으로 연구됨을 보여준다. Soil & Microbial 클러스터에서는 biochar-adsorption (21회), heavy metals-phytoremediation (15회) 연결이 두드러져 중금속 오염토양의 생물학적 정화 기술이 핵심 연구 주제임을 나타냈다. Water Quality 클러스터는 eutrophication, wastewater treatment 등과 연결되었으나, 상대적으로 다른 클러스터와의 연결이 제한적이었다.

    3.6. 국가별 분석

    7개 대분류 주제별 국가 분포를 분석한 결과 (Fig. 7), 토양 정화 분야는 중국 (2,174편)이 압도적으로 높은 연구 활동을 보였으며, 미국 (261편), 한국 (216편)이 뒤를 이었다. 수질 개선 분야에서도 중국 (1,399편)이 선도하였고, 미국 (433편), 한국 (162편) 순이었다. 서식지 복원 분야는 중국 (522편), 미국 (265편), 호주 (92편)가 상위를 차지하였다. 자연기반해법 분야는 미국 (113편)이 선도하고 중국 (68편), 영국 (59편) 등이 뒤따랐다. 종자 기반 복원은 중국 (70편), 미국 (54편), 호주 (21편) 순이었으며, 오염지 복원은 중국 (97편), 미국 (32편), 한국 (25편) 순으로 나타났다. 산불 관리 분야는 미국 (55편)이 주도하고 있었다. 국가별 총 논문 수를 분석한 결과 (Fig. 8), 중국이 4,341편으로 1위를 차지하였고, 미국 (1,213편), 한국 (429편), 호주 (307편), 영국 (306편) 순이었다. 한국은 429편으로 세계 3위를 기록하였으며, 특히 토양 복원 (216편)과 수질 개선 (162편) 분야에서 강점을 보였다. 상위 15개국 외 45개국에서 1,043편이 발표되어 생태복원 연구의 지리적 다양성을 보여주었다.

    3.7. 한국 연구 동향 분석

    국내 논문 429편의 대분류별 분포를 분석한 결과 (Fig. 9), 토양 복원이 216편 (50.3%)으로 가장 높은 비중을 차지하였으며, 수질 개선 162편 (37.8%), 오염지 복원 25편 (5.8%), 서식지 복원 11편 (2.6%), 자연기반해법 10편 (2.3%) 순이었다. 세부 토픽별로는 미생물 활용 (171편, 39.9%), 토양 기반 처리 (124편, 28.9%), 바이오차 활용 (46편, 10.7%)이 상위를 차지하여 생물학적 정화 기술 연구가 주를 이루었다.

    연도별 추이를 살펴보면, 2002년 첫 논문 발표 이후 꾸준히 증가하여 2019년 50편으로 최고치를 기록하였다. 2020년 이후에도 연평균 37.6편을 유지하며 활발한 연구 활동이 지속되고 있다.

    전체 연구 동향과 비교했을 때, 한국은 토양 복원 (전체 39.0% vs 한국 50.3%, +11.4%p)과 수질 개선 (전체 32.7% vs 한국 37.8%, +5.1%p) 분야에서 높은 비중을 보인 반면, 서식지 복원 (전체 14.9% vs 한국 2.6%, -12.4%p)과 자연기반해법 (전체 6.3% vs 한국 2.3%, -4.0%p) 분야는 상대적으로 낮았다. 이는 한국의 생태복원 연구가 환경오염 문제 해결을 위한 기술 개발에 집중되어 있음을 보여준다.

    4. 고 찰

    4.1. BERTopic 분석의 효용성

    본 연구에서 적용한 반복적 BERTopic 모델링은 기존 키워드 기반 문헌 분석의 한계를 보완하는 데 효과적이었다. 전통적인 키워드 분석은 특정 용어의 출현 빈도에 의존하므로, 동일한 키워드가 상이한 맥락에서 사용되는 경우를 구분하지 못한다. 예를 들어, ‘restoration’이라는 키워드는 생태복원뿐만 아니라 치과의수복 치료 (dental restoration)나 간 기능 회복 (liver restoration) 등 생의학 분야에서도 빈번히 사용된다. 실제로 본 연구에서 활용한 PubMed는 생의학 중심의 데이터베이스로서 생태복원 관련 키워드 검색 시 이러한 의학·생물학 연구가 다수 포함되어 있었으나, BERTopic이 문헌의 의미적 맥락을 반영하여 주제를 군집화함으로써 이를 체계적으로 분류하고 효과적으로 제외할 수 있었다.

    4.2. 주요 연구 주제의 특성

    생태복원 연구는 크게 환경 정화 기술 (토양 복원, 수질 개선)과 생태적 복원 (서식지 복원, 자연기반해법)으로 양분되는 구조를 보였다. 토양 복원과 수질 개선이 전체 연구의 71.2%를 차지하는 것은 환경오염 문제 해결을 위한 생물학적 기술 개발이 생태복원 연구의 주류를 형성하고 있음을 보여준다. 토픽 간 유사도 분석에서 Biochar Adsorption 토픽이 Microbial Soil Remediation (0.89), Heavy Metal Contamination (0.85) 토픽과 높은 유사도를 보이며 토양 정화 분야와 강하게 연결된 것은 바이오차가 토양 복원의 핵심 기술로 자리잡았음을 시사한다. 키워드 네트워크 분석에서도 heavy metals, phytoremediation, biochar가 강하게 연결된 Soil & Microbial 클러스터가 형성되어, 중금속 오염토양의 생물학적 정화 기술이 핵심 연구 주제임이 확인되었다 (Sharma et al. 2023).

    국내에서도 이러한 연구 주제들에 대한 활발한 연구가 진행되고 있다. Park et al. (2025)은 폐광산 토양에서 중금속 오염이 미생물 대사 기능에 미치는 영향을 분석하여 토양 건강성 평가 지표를 제시하였으며, 이는 오염부지 복원 계획 수립의 기초자료로 활용될 수 있다. 수질 개선 분야에서는 미생물 활용 기술이 활발히 연구되고 있다. Hwang et al. (2020)은 미세조류 Ankistrodesmus bibraianus를 활용한 축산폐수 처리 기술을, Cho et al. (2023)은 갯지렁이 유래 세균을 활용한 양식폐수 처리 기술을 보고하였다. 또한 Kim and Choi (2023)는 유해 남조류 유래 독소 (마이크로 시스틴)의 제거 기술을 종합적으로 검토하여 흡착 기반수 처리 기술의 적용 가능성을 제시하였다.

    4.3. 연구 성장 동향

    대분류 주제별 연평균성장률 분석 결과, 자연기반해법이 22.8%로 가장 높은 성장률을 보였다. 2016년 IUCN이 NbS 개념을 정립한 이후 (Cohen-Shacham et al. 2016), 도시 생태계와 기후변화 적응을 위한 녹색 인프라 연구가 급증하였으며, 키워드 네트워크에서 NbS가 ecosystem services, climate change, biodiversity와 강하게 연결된 것은 NbS가 생태계서비스 증진 및 기후변화 대응과 통합적으로 연구되고 있음을 보여준다. 특히 nature-based solutions가 네트워크의 중심 허브로 나타난 것은 NbS가 다양한 연구 주제를 연결하는 핵심 분야임을 시사한다. 이는 전통적인 생태복원을 넘어 사회적 문제 해결과 연계된 통합적 접근의 필요성을 반영한다.

    4.4. 한국 생태복원 연구의 현황과 과제

    한국이 세계 3위를 기록한 것은 환경오염 문제 해결에 대한 국내 연구역량이 높음을 보여준다. 특히 토양 복원과 수질 개선 분야에 연구가 집중된 것은 산업화 과정에서 발생한 중금속 오염, 수계 부영양화 등의 환경 문제에 대응하기 위한 기술 개발 수요를 반영하는 것으로 사료된다. 미생물 활용, 바이오차 활용 등 생물학적 정화 기술이 주요 연구 분야로 나타난 것도 이러한 맥락에서 이해할 수 있다.

    그러나 국제적 연구 동향과 비교했을 때, 서식지 복원과 자연기반해법 분야의 연구 비중이 상대적으로 낮은 점은 향후 보완이 필요한 부분이다. 최근 전 세계적으로 NbS가 기후변화 대응과 도시 환경 개선의 핵심 전략으로 주목받고 있으며, 유럽연합과 미국 등에서는 NbS를 환경정책의 주요 수단으로 채택하고 있다. 한국도 도시화율이 높고 기후변화 영향에 취약한 점을 고려할 때, 이 분야의 연구 확대가 필요하다.

    분야별로 토양 정화와 수질 개선에서 중국이 주도하고 있는 것은 급속한 산업화에 따른 환경오염 문제 해결 수요를 반영하는 것으로 사료된다. 반면 서식지 복원은 미국과 호주, 자연기반해법은 미국과 유럽 국가들이 선도하고 있어, 지역별 환경 문제와 정책 우선순위에 따른 연구 특성화가 나타났다. UN 생태계 복원 10년의 목표 달성을 위해서는 이러한 지역 간 상호 보완적 접근과 지식 교류가 필요할 것이다.

    향후 한국의 생태복원 연구는 기존의 오염 정화 기술 강점을 유지하면서, 자연기반해법 및 생태계서비스 증진과 연계된 통합적 복원 연구로 확대될 필요가 있다. 특히 도시 녹색인프라, 기후변화 적응형 복원 기술, 생태계서비스 평가 등은 국제적 연구 흐름에 부합하면서도 국내 환경 문제 해결에 기여할 수 있을 것이다.

    4.5. 연구의 한계 및 향후 방향

    방법론적 측면에서, BERTopic은 기존의 LDA에 비해 문맥적 의미를 더 잘 포착하여 보다 일관성 있는 토픽 분류를 가능하게 하였다. 그러나 초기 분석에서 미분류 문헌의 비율이 높다는 한계가 있어, 본 연구에서는 4차에 걸친 반복적 재분류를 통해 최종 분류율을 58.1%까지 향상시켰다.

    본 연구는 몇 가지 한계를 가진다. 첫째, PubMed 데이터베이스만을 활용하였다는 점에서 데이터 범위의 제약이 있다. PubMed는 생의학 분야 중심의 데이터베이스로, Restoration Ecology, Ecological Engineering, Journal of Applied Ecology 등 생태복원 분야의 핵심 저널 일부가 포함되지 않았을 수 있다. 따라서 본 연구 결과는 생물학적 복원 기술에 편중되어 있을 가능성이 있다. 둘째, 영어 논문만을 대상으로 하여 비영어권 연구의 동향이 충분히 반영되지 않았을 수 있다. 셋째, 초록만을 분석 대상으로 하여 전문 (full-text) 분석에 비해 정보량이 제한적일 수 있다. 넷째, 토픽 분류 및 명명 과정에서 연구자의 주관적 판단이 개입되었다. BERTopic은 자동으로 토픽을 군집화하지만, 각 토픽의 명명과 대분류 체계 수립은 연구자가 수행하였다. 다섯째, 국가별 분석에서 주저자의 소속 기관만을 기준으로 하였기 때문에 국제 공동연구의 기여도가 충분히 반영되지 않았을 수 있다.

    향후 연구에서는 Web of Science, Scopus 등 다양한 데이터베이스의 통합, 다국어 분석 확대, 전문가 패널의 검토를 통한 분류 타당성 검증, 그리고 공저자 네트워크 분석을 통한 국제 협력 현황 파악이 필요할 것이다.

    적 요

    본 연구는 신경망 기반 토픽 모델링 기법인 BERTopic을 활용하여 1992년부터 2024년까지 발표된 생태복원 기술 관련 학술논문 9,557편의 연구 동향을 분석하였다. 분석 결과, 토양 복원 (38.7%), 수질 개선 (32.5%), 서식지·생물 다양성 복원 (15.2%), 자연기반해법 (6.3%), 종자 기반 복원 (3.4%), 오염지 복원 (2.8%), 산불 관리 (1.0%)의 7개 주요 연구 영역이 도출되었다. 연평균성장률 분석 결과, 자연기 반해법이 22.8%로 가장 높은 성장률을 보였으며, 토양 복원 (21.4%), 종자 기반 복원 (20.1%) 순이었다. 키워드 네트워크 분석에서는 자연기반해법, 토양·미생물, 수질의 3개 주요 클러스터가 확인되었으며, 자연기반해법이 다양한 연구 주제를 연결하는 중심 허브로 나타났다. 국가별 분석에서 중국이 4,341편으로 1위를 차지하였고, 한국은 429편으로 세계 3위를 기록하며 특히 토양 복원 (216편)과 수질 개선 (162편) 분야에서 강점을 보였다. 반복적 BERTopic 분석은 유사한 용어를 공유하는 생의학 연구로부터 생태복원 연구를 효과적으로 구분하여 기존 키워드 기반 분석의 한계를 극복하였다. 본 연구 결과는 생태복원 연구의 발전 양상과 지역적 특성을 파악하고 향후 연구 방향 설정에 기여할 수 있다.

    ACKNOWLEDGEMENTS

    This Study was supported by the National Institute of Ecology (NIE-B-2025-18).

    CRediT authorship contribution statement

    H Seo: Conceptualization, Methodology, Formal analysis, Writing-Original draft. G Kim: Data curation, Writing- Review & editing. G Ock: Methodology, Writing-Review & editing.

    Declaration of Competing Interest

    The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

    Figure

    KJEB-43-4-537_F1.jpg

    Annual publication trends in ecological restoration research from 1992 to 2024. The graph shows a steady increase in publications, with a notable acceleration after 2010.

    KJEB-43-4-537_F2.jpg

    Iterative BERTopic analysis process. From 16,439 papers, 22 relevant topics (9,557 papers, 58.1%) were identified, and 36 off -topic themes (6,882 papers, 41.9%) were excluded through four iterations.

    KJEB-43-4-537_F3.jpg

    Distribution of 22 final topics by category. A horizontal bar chart shows the classification of 22 BERTopic-identified topics into 15 subcategories and 7 major categories. Bar colors indicate major categories; solid lines separate major categories, and dashed lines separate subcategories. Topic abbreviations are listed in Table 2.

    KJEB-43-4-537_F4.jpg

    Compound Annual Growth Rate (CAGR) by major research category from 2015 to 2024.

    KJEB-43-4-537_F5.jpg

    Topic similarity heatmap showing cosine similarity between 22 topics. Topic abbreviations are listed in Table 2.

    KJEB-43-4-537_F6.jpg

    Keyword co-occurrence network in ecological restoration research. The network consists of 21 keywords and 106 edges based on co-occurrence frequency in author keywords from 9,557 publications. Node size represents total connection weight. Three clusters are identified: Nature-based Solutions (purple), Soil & Microbial (green), and Water Quality (cyan).

    KJEB-43-4-537_F7.jpg

    Spatial distribution of ecosystem restoration research by seven major categories. Country-level analysis was performed on 9,151 publications with valid country information (excluding 406 publications with unknown/missing data from 9,557 total). Bubble size represents publication count; country names are labeled for bubbles with more than 50 publications.

    KJEB-43-4-537_F8.jpg

    Global ranking of ecosystem restoration research by country. Analysis is based on 9,151 publications with valid country information (excluding 406 publications with unknown/missing data). Stacked bars show topic distribution for the top 15 countries. “Others” represents 45 additional countries with 1,043 publications combined.

    KJEB-43-4-537_F9.jpg

    South Korea’s ecological restoration research trends (n=429). (a) Distribution by seven major topics showing concentration in Soil Remediation (50.3%) and Water Quality Improvement (37.8%). (b) Annual publication trend from 2002 to 2024, with peak output in 2019 (n=50).

    Table

    Search keywords used for literature collection

    ※ Each keyword includes suffixes such as technolog*, method*, and plural forms

    Classification results of ecological restoration technology research topics (7 major categories, 15 subcategories, 22 topics)

    Reference

    1. Akiba T, S Sano, T Yanase, T Ohta and M Koyama. 2019. Optuna: A next-generation hyperparameter optimization framework. pp. 2,623-2,631. In: Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Association for Computing Machinery. Anchorage, AK, USA.
    2. Allaoui M, ML Kherfi and A Cheriet. 2020. Considerably improving clustering algorithms using UMAP dimensionality reduction technique: A comparative study. pp. 317-325. In: Image and Signal Processing (El Moataz A, D Mammass, A Mansouri and F Nouboud, eds.). Lecture Notes in Computer Science. Vol. 12119. Springer. Cham, Switzerland.
    3. AlRyalat SAS, LW Malkawi and SM Momani. 2019. Comparing bibliometric analysis using PubMed, Scopus, and Web of Science Databases. J. Vis. Exp. 152:e58494.
    4. Blei DM, AY Ng and MI Jordan. 2003. Latent dirichlet allocation. J. Mach. Learn. Res. 3:993-1022.
    5. Campello RJGB, D Moulavi, A Zimek and J Sander. 2015. Hierarchical density estimates for data clustering, visualization, and outlier detection. ACM Trans. Knowl. Discov. Data 10:1-51.
    6. Cho JY, KS Cho, CH Kim and JK Kim. 2023. Identification of bacteria isolated from rockworm viscera and application of isolated bacteria to shrimp aquaculture wastewater treatment. Korean J. Environ. Biol. 41:167-178.
    7. Clewell AF and J Aronson. 2013. Ecological Restoration: Principles, Values, and Structure of an Emerging Profession. 2nd ed. Island Press. Washington, DC, USA.
    8. Cohen-Shacham E, G Walters, C Janzen and S Maginnis. 2016. Nature-Based Solutions to Address Global Societal Challenges. IUCN International Union for Conservation of Nature. Gland, Switzerland.
    9. Egger R and J Yu. 2022. A topic modeling comparison between LDA, NMF, Top2Vec, and BERTopic to demystify Twitter posts. Front. Sociol. 7:886498.
    10. FAO, IUCN CEM, and SER. 2021. Principles for Ecosystem Restoration to Guide the United Nations Decade 2021-2030. Food and Agriculture Organization of the United Nations. Rome, Italy.
    11. Gann GD, T McDonald, B Walder, J Aronson, CR Nelson, J Jonson, JG Hallett, C Eisenberg, MR Guariguata, J Liu, F Hua, C Eche-verría, E Gonzales, N Shaw, K Decleer and KW Dixon. 2019. International principles and standards for the practice of ecological restoration. Second edition. Restor. Ecol. 27:S1-S46.
    12. Grootendorst M. 2022. BERTopic: Neural topic modeling with a class-based TF-IDF procedure. arXiv preprint.
    13. Guan Y, R Kang and J Liu. 2019. Evolution of the field of ecological restoration over the last three decades: a bibliometric analysis. Restor. Ecol. 27:647-660.
    14. Han M and Y Zhou. 2024. Exploring trends and emerging topics in oceanography (1992-2021) using deep learning-based topic modeling and cluster analysis. npj Ocean Sustain. 3:59.
    15. Hwang IS, YM Park, YE Lee, DW Kim, JS Park, EJ Oh, J Yoo and KY Chung. 2020. Removal of water pollutants and its application to swine wastewater treatment through the establishment of best optimal growth conditions of Ankistrodesmus bibraianus. Korean J. Environ. Biol. 38:82-92.
    16. Kim S and YE Choi. 2023. Review on hazardous microcystins originating from harmful cyanobacteria and corresponding eliminating methods. Korean J. Environ. Biol. 41:370-385.
    17. Li T, L Cui, Y Wu, R Pandey, H Liu, J Dong, W Wang, Z Xu, X Song, Y Hao, X Cui, J Du, X Zhang and Y Wang. 2025. Unveiling and advancing grassland degradation research using a BERTopic modelling approach. J. Integr. Agric. 24:949-965.
    18. McInnes L, J Healy and J Melville. 2018. UMAP: Uniform mani-fold approximation and projection for dimension reduction. arXiv preprint.
    19. Park M, Y Kim, Y Lee, D Kim, YJ An, S Hyun, SH Hong and J Wee. 2025. Community-level physiological profiling of microbial communities in abandoned mine soils. Korean J. Environ. Biol. 43:325-334.
    20. Reimers N and I Gurevych. 2019. Sentence-bert: Sentence embeddings using siamese bert-networks. arXiv preprint.
    21. Romero-Silva R and S De Leeuw. 2021. Learning from the past to shape the future: A comprehensive text mining analysis of OR/MS reviews. Omega 100:102388.
    22. Sharma JK, N Kumar, NP Singh and AR Santal. 2023. Phytoremediation technologies and their mechanism for removal of heavy metal from contaminated soil: An approach for a sustainable environment. Front. Plant Sci. 14:1076876.
    23. Shen Z, Y Tian, Y Yao, W Jiang, J Dong, X Huang, X Wu, TH Farooq and W Yan. 2023. Ecological restoration research progress and prospects: A bibliometric analysis. Ecol. Indic. 155:110968.
    24. UNEP. 2021. Becoming #GenerationRestoration: Ecosystem Restoration for People, Nature and Climate. United Nations Environment Programme. Nairobi, Kenya.
    25. Wallach HM. 2006. Topic modeling: Beyond bag-of-words. pp. 977-984. In: Proceedings of the 23rd International Conference on Machine Learning. Association for Computing Machinery. Pittsburgh, PA, USA.
    26. Wang X, J Lu, Z Song, Y Zhou, T Liu and D Zhang. 2022. From past to future: Bibliometric analysis of global research productivity on nomogram (2000-2021). Front. Public Health 10:997713.
    27. Wei X, W Song, Y Shao and X Cai. 2022. Progress of ecological restoration research based on bibliometric analysis. Int. J. Environ. Res. Public Health 20:520.

    Vol. 40 No. 4 (2022.12)

    Journal Abbreviation 'Korean J. Environ. Biol.'
    Frequency quarterly
    Doi Prefix 10.11626/KJEB.
    Year of Launching 1983
    Publisher Korean Society of Environmental Biology
    Indexed/Tracked/Covered By

    Contact info

    Any inquiries concerning Journal (all manuscripts, reviews, and notes) should be addressed to the managing editor of the Korean Society of Environmental Biology. Yongeun Kim,
    Korea University, Seoul 02841, Korea.
    E-mail: kjeb@koseb.org
    Tel: +82-2-3290-3496 / +82-10-9516-1611