The Society Of Korean Fiction

The Society Of Korean Fiction

Current Issue

The Journal of Korean Fiction Research - Vol. 0 , No. 94

[ Article ]
The Journal of Korean Fiction Research - Vol. 0, No. 90, pp. 5-38
ISSN: 1229-3830 (Print)
Print publication date 30 Jun 2023
Received 19 May 2023 Revised 08 Jun 2023 Accepted 08 Jun 2023
DOI: https://doi.org/10.20483/JKFR.2023.06.90.5

민족, 국민, 국가 : 시계열 워드 임베딩을 활용한 조선일보 기사의 민족 담론 의미 변동 추적(1920~40)
김병준** ; 전봉관***
**제1저자: KAIST 디지털인문사회과학센터, 연구조교수 (kuntakim88@gmail.com)
***교신저자: KAIST 디지털인문사회과학부, 교수 (junbg@kaist.ac.kr)

Minjok, Gungmin, Gukga : Tracking Changes in the Meaning of National Discourse in Chosun Ilbo Articles Using Dynamic Word Embedding (1920-40)
Kim, Byungjun** ; Jun, Bong Gwan***
Funding Information ▼

초록

이 논문은 1920년부터 창간호부터 1940년 폐간호까지 발간된 조선일보 데이터에서 정규 기사 844,251건을 추려낸 후 시계열 워드 임베딩(dynamic word embedding)과 추세 검정(trend test)을 활용해 민족 담론 관련 어휘(‘민족’, ‘국민’, ‘국가’)의 의미 변화를 통시적으로 그려내는 연구다. 그간 한국의 민족(주의) 담론관련 연구는 대부분 1910년 이전 텍스트를 대상으로 이뤄져 왔고, 소수의 텍스트를 정성적으로 읽어내는 방식이었다. 이 논문은 디지털인문학 방법론을 기반으로 일제강점기 20여 년간의 조선일보 전수 텍스트에 내재한 민족 담론을 읽어내는 시도이다. 우리는 연구 가설에 관한 네 가지 지점을 확인하였다: 1) ‘민족’, ‘국민’, ‘국가’는 분석 대상 단어 중에서 맥락 변화가 큰 주요 단어이다. 2) 민족의 맥락 변화는 조선일보의 내부 변화와 사회주의 및 일제 파시즘의 강화라는 외부 요인과 연결돼 있다. 3) ‘민족-국가’와 ‘국민-국가’의 시간에 따른 유사도는 서로 다른 추세를 보이며 변곡점은 내선일체 이데올로기의 강화된 시점이다. 4) ‘민족’과 ‘국민’의 맥락 분화는 계속 증가하며 이는 사회주의와 일제의 국민화 정책의 영향으로 볼 수 있다.

Abstract

This paper selects 844,251 regular articles from the Chosun Ilbo data, published from the first issue in 1920 to the last issue in 1940, and uses dynamic word embedding and trend tests to illustrate the changes in the meaning of national discourse-related vocabulary (‘minjok’, ‘gungmin’, and ‘gukga’) over time. Prior research on national discourse in Korea has focused primarily on texts written prior to 1910 and relied on qualitative readings of a limited number of texts. Using digital humanities methodology, this paper attempts to interpret the national discourse embedded in the texts of the Chosun Ilbo during the two decades of Japanese colonization. We determined four factors in relation to our research hypothesis:

1) “Minjok,” “gungmin,” and “gukga” are the most frequently occurring words with significant contextual differences among the words analyzed. 2) The contextual shift in ethnicity is a result of both internal and external factors, such as the consolidation of socialism and Japanese fascism. 3) The similarity between ‘minjok-gukga’ and ‘gungmin-gukga’ over time reveals distinct tendencies, with the turning point being the reinforcement of the “Japan and Korea are One Entity” ideology. 4) The increasing contextual distinction between “minjok” and “gungmin” can be attributed to socialism and Japanese nationalization policies.


Keywords: national discourse, Chosun Ilbo, digital humanities, dynamic word embedding, trend test
키워드: 민족 담론, 조선일보, 디지털인문학, 시계열 워드 임베딩, 추세 검정

Acknowledgments

이 논문은 2023년 2월 4일에 열린 한국근대문학회 제47회 학술대회 발표(「시계열 워드 임베딩으로 바라본 한국 근대 개념어의 변천」)를 기반으로 한다. 그리고 심사 과정에서 소중한 조언을 주신 익명의 심사자 분들께도 감사드린다. 이 논문은 2022년도 과학기술정보통신부의 재원으로 한국과학창의재단 과제 “인문사회-디지털(SW·AI) 융합연구소 지원”(D30300002)으로 수행한 연구이다.


참고문헌 1. 기본자료
1. 『조선일보』

2. 단행본
2. 장신, 『조선·동아일보의 탄생』, 역사비평사, 2021

3. 논문
3. 권보드래, 「근대 초기 “민족” 개념의 변화-1905~1910년 대한매일신보를 중심으로」, 『민족문학사연구』 33, 2007, 189–213면.
4. 김소영, 「甲午改革期(1894∼1895) 敎科書 속의 ‘國民’」, 『韓國史學報』 29, 2007, 171–208면.
5. 김소영, 「한말 지식인들의 ‘국민’ 성립론: 공통의 언어, 혈연, 역사 그리고 종교」, 『역사와 담론』 93, 2020, 137–180면.
6. 김한샘·장연지·강예지, 「통시 말뭉치에 기반한 언어 변화 연구—20세기 신문 말뭉치의 구축과 분석—」, 『한글』 81(4), 2020, 919–947면.
7. 김헌주, 「『조선일보』에 나타난 1920년대 식민지 조선의 역사지식장 -데이터베이스 분석을 중심으로-」, 『동방학지』 198, 2022, 77–100면.
8. 박명규, 「네이션과 민족: 개념사로 본 의미의 간격」, 『동방학지』 147, 2009, 27–65면.
9. 박용규, 「1920년대 중반(1924~1927)의 신문과 민족운동: 민족주의 좌파의 활동을 중심으로」, 『언론과학연구』 9(4), 2009, 287면.
10. 박찬승, 「한국에서의 “민족” 개념의 형성」, 『개념과 소통』 1, 2008, 79–120면.
11. 서재현 외 3인, 「멀리서 읽는 “우리”― Word2Vec, N-gram을 이용한 근대 소설 텍스트 분석」, 『대동문화연구』 115, 2021, 349–386면.
12. 송명진, 「구성된 민족 개념과 역사ㆍ전기소설의 전개 -신채호와 박은식의 민족 개념을 중심으로-」, 『현대문학의 연구』 46, 2012, 205–233면.
13. 오문석, 「근대문학의 조건, 네이션≠국가의 경험」, 『한국근대문학연구』 1(19), 2009, 203–228면.
14. 윤덕영, 「1930년대 동아일보 계열의 정세인식 변화와 배경 - 체제 비판에서 체제 굴종으로 -」, 『사학연구』 108, 2012, 191-261면.
15. 윤영실, 「‘국민’과 ‘민족’의 분화-『소년』지에 나타난 ‘신대한’과 ‘대조선’ 표상을 중심으로」, 『상허학보』 25, 2009, 79–114면.
16. 윤영실, 「자유주의 통치성, 제국주의, 네이션-블룬칠리 국가론과 nation(Volk)/people(Nation) 개념의 정치적 함의-」, 『사이間SAI』 30, 2021, 15–57면.
17. 윤영실, 「‘세 제국들 사이’의 식민지 ‘민족’—1900년대 말 제국주의적 인종 담론과 한국민족 개념의 역사적 생성」, 『한국현대문학연구』 68, 2022, 5–47면.
18. 윤영실, 「네이션, 국민자격, 식민지 민족—20세기 전환기 제국주의적 국민 담론의 계보학(1)」, 『상허학보』 67, 2023, 191-229면.
19. 이성우, 「『한국근대잡지코퍼스』로 엿보는 한국의 근대—키워드와 빈도를 중심으로—」, 『개념과 소통』 29, 2022, 45–79면.
20. 이지성, 「근대 ‘국민’, ‘인민’, ‘백성’의 개념사 연구」, 『전남대 어문논총』 39, 2021, 59–83면.
21. 임경석, 「조선공산당 창립대회 연구」, 『대동문화연구』 81, 2013, 347-376면.
22. 전성규·장연지, 「Word2Vec 분석을 통한 근대 계몽기 잡지에서의 ‘문명(文明)’의 시기별 지형도」, 『개념과 소통』 26, 2020, 135–182면.
23. 진대현 외 3인, 「Mann-Kendall 비모수 검정과 Sen’s slope를 이용한 최근 40년 남한지역 계절별 평균기온의 경향성 분석」, 『응용통계연구』 34(3), 2021, 439–447면.
24. 허수·김혜진·정유경, 「대한제국기 ‘집단적 주체’의 의미망― ≪황성신문≫과 ≪대한매일신보≫의 사설 기사를 중심으로」, 『대동문화연구』 119, 2022, 245–285면.
25. 허수, 「20세기 한국에서 사용된 ‘민중’의 의미—주요 신문 기사를 중심으로 -」, 『역사문제연구』 27(1), 2023, 173–219면.
26. 홍정완, 「근대전환기 한국학 지형 다시 읽기—신문 · 잡지의 한국 역사 · 문화 관련 텍스트 계량 분석을 중심으로」, 『역사문제연구』 24(1), 2020, 11–58면.
27. 홍정완, 「신문으로 읽는 1920년대 식민지 조선의 ‘조선 역사·문화’—『동아일보』, 『조선일보』의 ‘조선 역사·문화’ 관련 텍스트 계량 분석을 중심으로 -」, 『동방학지』 198, 2022, 1–37면.
28. Hamilton, W. L., Leskovec, J., & Jurafsky, D., “Diachronic word embeddings reveal statistical laws of semantic change”, arXiv preprint arXiv:1605.09096, 2016
29. Mann, H. B., “Nonparametric tests against trend”, Econometrica: Journal of the econometric society, 1945, 245–259p.
30. Rudolph, M., & Blei, D.,“Dynamic Embeddings for Language Evolution”, Proceedings of the 2018 World Wide Web Conference on World Wide Web - WWW ’18, 2018, 1003–1011p.
31. Timmermans, M., Vanmassenhove, E., & Shterionov, D.,““Vaderland”, “Volk” and “Natie”: Semantic Change Related to Nationalism in Dutch Literature Between 1700 and 1880 Captured with Dynamic Bernoulli Word Embeddings”, Proceedings of the 3rd Workshop on Computational Approaches to Historical Language Change, 2022, 125–130p.