00.Application of Crystal Graph Neural Network for Spatial Search of Halide Perovskite Potential Energy
Repository for my GNN Benchmark Research for Halide Perovskite
-
2022-08-30 : Googlecolab pro+ code๋ฅผ ์ฐ๊ตฌ์ค Workstation ์๋ฒ๋ก ๋ชจ๋ ์ด์
-
Date : 2022-04-05
-
Last Modified Date : 2022-08-15
- Graph Neural Network and Its Application for Computational Physics
์ด ์ฐ๊ตฌ๋ 2021๋ 1์์ ์ง๋๊ต์๋๊ป์ ๋ด๊ฒ ๋ณด์ฌ์ฃผ์ จ๋ ํ๋์ ๋ ผ๋ฌธ์์ ์์๋์๋ค.
ํด๋น ๋ ผ๋ฌธ์ **Crystal Graph Convolutional Neural Network (CGCNN)**๋ฅผ ์ต์ด๋ก ์ ์ํ์ฌ ๊ฒฐ์ ๊ตฌ์กฐ ๋ฌผ์ง์ ๋ํ ๋ฌผ์ฑ์์ธก์ ์๋ํ๋ ํ ์ฐ๊ตฌ์ ๊ดํ ๊ฒ์ด์๋ค. ์ฐ๊ตฌ์ ์ฌ์ฉ๋ ์ฝ๋๋ฅผ ์ ์๊ฐ Github Repository์ ๊ณต๊ฐํ์๊ธฐ ๋๋ฌธ์, ๊ทธ ์ฝ๋๋ฅผ ๋ค์ด๋ก๋ํ์ฌ ์ฝ๋ ๋ถ์์ ์์ํ์๋ค. ๋๋ต์ ์ธ ์ฝ๋ ๋ถ์์๋ ํ ๋ฌ ์ ๋์ ์๊ฐ์ด ์์๋์๋ ๊ฒ ๊ฐ๋ค.
์ฝ๋๋ PyTorch ๊ธฐ๋ฐ์ผ๋ก ์์ฑ๋์ด ์์๋๋ฐ, ๋น์์ ๋๋ TensorFlow, Keras๋ฅผ ์ฃผ ํ๋ ์์ํฌ๋ก ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ Torch์ ๋ํด์๋ ๊ธฐ๋ณธ์ ์ธ ์์ค์ ์ง์๋ฐ์ ์์๋ค. ๊ฒฐ๊ตญ ์ฝ๋๋ฅผ ๊น๊ฒ ์ดํดํ๊ธฐ ์ํด์๋ Torch์ ๋ํ ์ผ์ ์์ค์ ์ดํด๊ฐ ํ์ํ๊ณ , Torch๋ฅผ ๊ณต๋ถํ๋ ๊ธฐ๋๊ธด ์ฌ์ ์ ๋ค์ด๊ฐ๋ค. ์ฌ๋ฌ๊ฐ์ง๋ก ๋ณต์กํ์ง๋ง, ๊ฒฐ๊ตญ ๋๋ต์ ์ธ ๋ด์ฉ์ ๋ค๋ฅธ ๋ฅ๋ฌ๋ ํ๋ก์ ํธ์ ํฌ๊ฒ ๋ค๋ฅด์ง ์์๋ค.
์ฆ, ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ฑฐ๋ ์ด๋๊ฐ์์ ๊ฐ์ ธ์์, ์ ์ฒ๋ฆฌํ๊ณ , ์ ๊ฒฝ๋ง์ ๋ชจ๋ธ๋งํ์ฌ ํ์ต ํ ์ฑ๋ฅ์ ์ฒดํฌํ๋ ๊ฒ์ด ์ ๋ถ์๋ค. ๋ค๋ง, ์ ์๋ ๋ค์ํ ๋ฅ๋ฌ๋ ๋ ์ด์ด์ ๋ชจ๋ธ์ ์ง์ ์์ฑํ์๊ณ , ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ๋ ๋ค์ํ ๋ถ๋ถ์ด ๋ชจ๋ ์ ํ์ ์ธ Torch ์คํ์ผ ๋๋ ์ ์๊ฐ ์ง์ ์์ฑํ ์ปค์คํ ํจ์๋ค๋ก ๊ตฌ์ฑ๋์ด ์์๋ค.
ํ์ฌ ์์ ์ ๋ด๊ฐ ๋ณด๊ธฐ์๋ ๊ทธ๋ ๊ฒ๊น์ง ์ด๋ ค์ด ์์ค์ ์ฝ๋๋ ์๋์ง๋ง, Torch๋ฅผ ์ฒ์ ์ ํ๋ ์์ ์ ๋ด๊ฐ ๋ณด๊ธฐ์๋ ๊ต์ฅํ ๋ณต์กํ๊ณ ํฐ ๊ท๋ชจ์ ํ๋ก์ ํธ ์ฝ๋๋ก ๋ณด์๋ค. ๊ฒฐ๊ตญ ํจ์์ ํด๋์ค, ๋ฉ์๋๋ฅผ ํ๋ํ๋ ๋ถ์ํ๋ฉฐ ์ฝ๋ ๋ฆฌ๋ทฐ๋ฅผ ํ๊ฒ ๋์๋ค.
์๊ฐํด๋ณด๋ฉด, ์ด ๋๊ฐ ๋์ ํ๋ก๊ทธ๋๋ฐ ๊ฒฝํ์์ ์ฒ์์ผ๋ก ์ง์งํ๊ฒ ํ์ธ์ ์ฝ๋๋ฅผ ๋ถ์ํ ์ฒซ ์ฌ๋ก์๋ ๊ฒ ๊ฐ๋ค. ์ด์ ๊น์ง๋ ํ์ธ์ ์ฝ๋๋ฅผ ์ฃผ์๊น๊ฒ ๋ณผ ํ์๊ฐ ์์๊ณ , ๊ฐ๋ ์ธํฐ๋ท์์ ๋ณด์ด๋ ๋ช ์ค ์๋๋ ์ฝ๋๊ฐ ์ ๋ถ์๊ธฐ ๋๋ฌธ์ ์ฝ๋ ๋ถ์์ ์ด๋ ค์์ ๋๋ผ๋ ๊ฒ์ด ์์๋ค. ๊ทธ๋ฌ๋ ์ฐ๊ตฌ์์ ์ฒ์์ผ๋ก ๊ฒฝํํ๊ฒ ๋, MIT ๋ฌผ๋ฆฌํ๊ณผ ๋ฐ์ฌ๊ณผ์ ํ์์ด ๋ฐํํ ๋ฌผ์ฑ์์ธก ์ฝ๋๋ ์ธํฐ๋ท์์ ๋ ๋๋ ์ฝ๋์๋ ์ ๋ง ์ฐจ์์ด ๋ค๋ฅธ ์์ค์ด์๋ค. ๊ทธ๊ฒ๋ค์ ์์ ํ ์์ค์ผ๋ก ์ดํดํ๋ ๋ฐ์๋ ๋ด ์๊ฐ๋ณด๋ค ํจ์ฌ ์ค๋ ์๊ฐ์ด ๊ฑธ๋ ธ๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ณผ์ ์์ ์ ๋ง ๋ง์ ๊ฒ์ ๋ฐฐ์ ๋ค๊ณ ์๊ฐํ๋ค.
์ง๊ธ์ ๋๋ CGCNN์ ๋น๋กฏํ์ฌ ๋ค์ํ ์์ค์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋๋ฆ๋๋ก ์ ์ดํดํ ์ ๋์ ์ง์์ ๊ฐ๊ฒ ๋์๋ค๊ณ ์กฐ์ฌ์ค๋ฝ๊ฒ ์๊ฐํ๋ค. ๊ทธ๋ฆฌ๊ณ ๋ฌธ์ ์ํฉ์ ๋ง์ถฐ ์ ์ ํ ์ปค์คํ ์ ํ ์๋ ์๋ค. ๋ํ, CGCNN ์ฝ๋๋ก๋ถํฐ ์์ค ๋์ ์ฝ๋ฉ์คํ์ผ๊ณผ ๊ฐ์ฒด์งํฅ ํ๋ก๊ทธ๋๋ฐ์ ๋ํ ๊ฐ๊ฐ๋ ์ตํ ์ ์์๋ค. ์ด์ ๋ ํด๋น ์ฐ๊ตฌ๊ฐ ๊ฐ๊ณ ์๋ ์ถฉ๋ถํ์ง ์์ ์ ๋ ๋นํ์ ์ผ๋ก ์ง์ ํ ์ ์๊ฒ ๋์๋ค.
์ด ๊ธ์์๋, ์ง๊ธ๊น์ง ๋ด๊ฐ ์งํํด์จ CGCNN๊ณผ ๊ด๋ จ๋ ๊ณต๋ถ ๋ฐ ์ฐ๊ตฌ์ ์ฌ์ ์ ๊ธฐ์ต๋๋๋๋ก ๋ชจ๋ ์ ์ด๋ณด๊ณ ์ ํ๋ค.
์ฐ๊ตฌ ๋ฐฐ๊ฒฝ์ ๋ํด ๋จผ์ ์ค๋ช ํ์๋ฉด, ๊ธฐ๋ณธ์ ์ผ๋ก **๋ฌผ์ฑ์์ธก(Prediction of Physical/Chemical Property)**๋ฅผ ํ๊ธฐ ์ํจ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
์ฐ๋ฆฌ ์ฃผ๋ณ์ ์ธ์์ ๋ณด์. ์ฐ์ฃผ๋ ์๋ง์ **๋ฌผ์ง(Material)**๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ๊ฑด๋ฌผ์ ๋จ๋จํ ๊ฑด์ถ์์ฌ๋ก ๊ตฌ์ฑ๋๊ณ , ์ข ์ด๋ ๋๋ฌด๋ฅผ ๊ตฌ์ฑํ๋ ๋ค์ํ ์ ๊ธฐ๋ฌผ๋ก๋ถํฐ ๋ง๋ค์ด์ง๋ค. ๋ด๊ฐ ์ง๊ธ ์ฌ์ฉ์ค์ธ ์ปดํจํฐ์ ๋ชจ๋ํฐ, ํค๋ณด๋๋ ๋ฐ๋์ฒด์ ๊ณต์ ์ฉ ๊ธ์, ์๋ฃจ๋ฏธ๋, ํ๋ผ์คํฑ ๋ฑ ์ด๋ค ๋๊ตฌ๋ฅผ ๋ง๋ค๊ธฐ์ ์ ํฉํ ๋ฌผ์ฑ์ ๊ฐ์ง ๋ฌผ์ง๋ก ๋ง๋ค์ด์ ธ ์๋ค. ๋ ์์ ์๋ฌด๊ฒ๋ ์๋ ๊ณต๊ฐ์ ์์ผ๋ก ํ์ ์ผ๋ฉด ์ ๋๋ก ์ง๊ฐ๋๊ธฐ ์ด๋ ต์ง๋ง, ๊ทธ ๊ณต๊ฐ์ ์ฑ์ฐ๊ณ ์๋ ์๋ง์ ๊ณต๊ธฐ ๋ถ์๋ค์ด ์์ง์ผ ๊ฒ์ด๋ค. ์ฐ๋ฆฌ๋ ์ด์๊ฐ๋ฉด์ ์ด๋ฌํ ๋ฌผ์ง์ ํ์ฉํ๋ค. ์ด๋ค ๋ฌผ์ง์ ๊ฑฐ์ ๊ทธ๋๋ก ํ์ฉ๋๊ณ , ์ด๋ค ๋ฌผ์ง์ ๊ทธ๋ ์ง ์๋ค. ์๋ฅผ ๋ค๋ฉด, ๋๋ฌด์์ ๊ณผ์ผ์ ๋ฐ์ ๋จน๋๋ค๋ฉด, ๊ทธ๊ฒ์ ํน๋ณํ ๊ฐ๊ณต๊ณผ์ ์ ๊ฑฐ์น์ง ์๊ณ ๊ฑฐ์ ๊ทธ๋๋ก ํ์ฉ๋ ์ ์ด๋ค. ๋ฐ๋ฉด, ์ด๋ค ๋ฌผ์ง์ ๊ทธ๋ ์ง ์๋ค. ๋ง์ฝ ๋น์ ์ด ์์์ ์ธ ์ํํ๊ฒฝ์์ ์ง์ ์ง๊ณ ์ ํ๋ค๋ฉด, ์ง์ ๊ตฌ์ฑํ๋ ๋ค์ํ ๊ฑด์ถ์์ฌ๋ค์ ์ํ(Raw-material)์ ์ค๋นํด์ผ ํ ๊ฒ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ฐ๊ฐ์ ๋ํ ๊ฐ๊ณต์ ํด์ผ ํ ๊ฒ์ด๋ค. ๊ทธ๊ฒ๋ค์ ์กฐํฉํ์ฌ ์ง์ ๋ง๋ค๊ฒ ๋ ๊ฒ์ด๋ค.
์ฌ๊ธฐ์ ์ค์ํ ๊ฒ์, ์ฐ๋ฆฌ๊ฐ ์ด๋ค ๋ชฉ์ ์ ์ด๋ฃจ๊ธฐ ์ํด ์ฃผ๋ณ์ ๋ฌผ์ง์ ํ์ฉํ ๋, ํน์ ํ ์ข ๋ฅ์ ๋ฌผ์ง๋ง์ด ์ ํฉํ๋ค๋ ์ฌ์ค์ด๋ค. ์๋ฅผ ๋ค๋ฉด, ํผํผํ ์ฐฝ๊ณ ๋ฅผ ๋ง๋ค๋ ค๊ณ ํ ๋ ๋น์ ์ด ์์ฐ์ค๋ฝ๊ฒ ์์ฌ๋ก ๊ณ ๋ คํ๋ ๊ฒ์ ๊ทผ์ฒ์ ์๋ ๋ฐ์, ๋๋ฌด์ ๊ฐ์ ๋จ๋จํ ์ฌ์ง์ ๋ฌด์ธ๊ฐ์ผ ๊ฒ์ด๋ค. ์ฐฝ๊ณ ์ ๋ฒฝ์ ๋ฌผ๋ ํ ์ฌ์ง๋ก ๋ง๋ ๋ค๋๊ฐ, ํน์ ๋ฌผ๊ณผ ๊ฐ์ ์ก์ฒด๋ก ๊ตฌ์ฑํ๋ ค๋ ์๊ฐ์ ์ ์ด์ ํ์ง ์์ ๊ฒ์ด๋ค. ์ฆ, ์ฐ๋ฆฌ๊ฐ ๋ฌผ์ง์ ํ์ฉํ ๋๋ ์ ํฉํ ๋ฌผ์ฑ(Desired Property)์ ๊ฐ๋ ๋ฌผ์ง๋ง์ด ํ์ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ฌ๊ธฐ์์ ๋ชจ๋ ๊ฒ์ด ์์๋๋ค.
์กฐ๊ธ ๋ ๊ตฌ์ฒด์ ์ผ๋ก, ๋น์ ์ด ํจ์จ์ ์ธ **ํ์์ ์ง(Solar Cell)**๋ฅผ ๊ฐ๋ฐํ๋ ์ฐ๊ตฌ์์ด๋ผ๊ณ ํ์. ํ์์ ์ง๋ ๋ง ๊ทธ๋๋ก ํ์์ผ๋ก๋ถํฐ ๋ฐฑ์๊ด์ ๋ฐ์ ์ ๊ธฐ๋ฅผ ์์ฐํ ์ ์๊ฒ ๋์์ฃผ๋ ์นํ๊ฒฝ์ ์ธ ์์์ด๋ค. ์์ญ๋ ๋์ ํ์์ ์ง์ ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํ ๋ค์ํ ์ฐ๊ตฌ๊ฐ ์งํ๋์๊ณ , ํ ์์ ์์๋ ๋ค์ํ ๋ฌผ์ง์ด ํ์์ ์ง์ ํ๋ณด๋ฌผ์ง๋ก ์ฐ๊ตฌ๋๊ณ ์๋ค. ๊ทธ๋ฆฌ๊ณ ํ์์ ์ง์ ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํด ์ฐ๊ตฌ๋๋ ์ ๋งํ ํ๋ณด๋ฌผ์ง ์ค ํ๋์๋ **ํ๋ก๋ธ์ค์นด์ดํธ(Perovskite)**๋ผ๋ ๊ฒ์ด ์๋ค. ํ๋ก๋ธ์ค์นด์ดํธ์ ํํ์์ **$ABX_3$**๋ก ํํ๋๋๋ฐ, ์๋ฆ๋ค์ด ๊ฒฐ์ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋ ๋ฌผ์ง๊ตฐ์ด๋ค. ์ด๊ฒ์ ์ต๊ทผ ๋ช ๋ ๋์ ํ์์ ์ง์ ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํด ์ฌ์ฉ๋ ์ธ๊ธฐ์๋ ํ๋ณด๋ฌผ์ง์ด๋ผ๊ณ ํ๋ค.
๊ทธ๋ ๋ค๋ฉด ์ด ๋ถ์ผ์ ์ฐ๊ตฌ์๋ค์ด ํ๋ ๋ค์ํ ๊ณ ๋ฏผ๋ค ์ค์๋ ์ด๋ฐ ๊ฒ์ด ์์ ๊ฒ์ด๋ค.
'ํ์์ ์ง์ ํจ์จ์ ๋์ด๊ธฐ ์ํด์๋ ์ค๊ฐ์ ํน์ ํ ๋ฌผ๋ฆฌ์ ์ฑ์ง์ ๊ฐ๋ ์ธต์ด ์์ผ๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค. ๊ทธ๋ฐ๋ฐ ๊ทธ๋ฐ ๋ฌผ์ฑ์ ๊ฐ๋ ๊ตฌ์กฐ๋ฅผ ์ด๋ป๊ฒ ์ฐพ์๋ด์ง?'
์ด๋ค ๋ฌผ์ง์ ๋ฃ๊ณ ์คํ์ ํ์ ๋, ์์ ๋ ๋ฒจ์์ ๋ฌผ์ง์ ์ํธ์์ฉ์ด ์ด๋ป๊ฒ ๋ ์ง ๋ฏธ๋ฆฌ ์์ธกํ๋ ๊ฒ์ ๋งค์ฐ ์ด๋ ค์ด ์ผ์ด๋ค. (์์ฃผ ๋ถ๊ฐ๋ฅํ์ง๋ ์๋ค) ์ด ์ธ์์๋ ์จ๊ฐ ๋ค์ํ ๊ตฌ์กฐ์ ์กฐ์ฑ์ ๊ฐ๋ ๋ฌผ์ง๋ค์ด ์๊ณ , ์ด ๋ชจ๋ ๊ฒฝ์ฐ์ ์๋ฅผ ์ผ์ผ์ด ๋ค ํ์ธํด๊ฐ๋ฉฐ ์ฐ๊ตฌ๋ฅผ ํ ์๋ ์๋ค. ์คํ๋ฌผ๋ฆฌ๋ฅผ ํ๋ ์ฐ๊ตฌ์๋ค์ด ์ด๋ฐ ๊ณ ๋ฏผ์ ํ ๋, ๋ฌผ๋ฆฌํ์ ๋ค๋ฅธ ๋ถ์ผ์์๋ ํฅ๋ฏธ๋ก์ด ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์์๋ค.
์์์ญํ์ ๋ฐ์ ์ดํ ์ ๋ฆฝ๋ ์์์ ์ํธ์์ฉ์ ๊ดํ ์ด๋ก ๊ณผ ์ปดํจํฐ์ ์ฐ์ฐ๋ฅ๋ ฅ์ ๊ฒฐํฉํ์ฌ ์ด๋ก ์ ์ธ ์๋ฎฌ๋ ์ด์ ์ ์ํํจ์ผ๋ก์จ, ์ค์ ์คํ์ ํ์ง ์๊ณ ๋ ๋ฌผ์ง ๋ด๋ถ์ ๋ณต์กํ ์ํธ์์ฉ์ ์ด๋ ์ ๋ ์์ธกํ๋ ๋ฐฉ๋ฒ์ด ๋ฐ๋ฌ๋์ด ์๋ค.
**๊ณ์ฐ๋ฌผ๋ฆฌํ(Computational Physics)**์ผ๋ก ๋ถ๋ฆฌ๋ ์ด ๋ถ์ผ๋, ์์ ์์ค์์ ์ผ์ด๋๋ ๋ณต์กํ ์ํธ์์ฉ์ ์์์ญํ์ ์ด๋ก ์ ๊ธฐ๋ฐํ์ฌ ์์์ ์ธ์ฐ๊ณ , ์ปดํจํฐ์ ์ฐ์ฐ๋ฅ๋ ฅ์ ์ด์ฉํ์ฌ ์์น์ ์ผ๋ก ํ์ดํจ์ผ๋ก์จ ๋ฌผ์ง ๋ด๋ถ์ ์ธ์์ ๋ณด๊ณ ์ ํ์๋ค.
๋์ ์ง๋๊ต์๋์ ์ ๋ฌธ๋ถ์ผ์ธ ์ด๊ฒ์ ๋ค์ํ ์ธ๋ถ๋ถ์ผ๊ฐ ์๋๋ฐ, ๊ทธ ์ค์์ ๋ด๊ฐ ๋ฐฐ์ด ๊ฒ์ **๋ฐ๋๋ฒํจ์ ์ด๋ก (Density Functional Theory, DFT)**๋ผ๊ณ ๋ถ๋ฆฐ๋ค. ๋ณดํต ๊ณ์ฐ๋ฌผ๋ฆฌํ ๋ถ์ผ์์๋ DFT๊ฐ ์ฃผ๋ฅผ ์ด๋ฃจ๊ณ , ๊ณ์ฐํํ์ด๋ ์ฌ๋ฃ๋ถ์ผ์์๋ ๊ด์ ์ ๋ฐ๋ผ ์ ์ฐ์ ์ฒด์ญํ(Computational Fluid Dynamics, CFD), ๋ถ์๋์ญํ(Molecular Dynamics, MD) ์๋ฎฌ๋ ์ด์ ๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ๋ก ์ ๊ณ ๋ คํ๋ค๊ณ ํ๋ค. ์ด์จ๋ ์ฌ๊ธฐ์ DFT๋ ๋ฌผ์ง ๋ด๋ถ์ ๋ณต์กํ ์ํธ์์ฉ์ ์๋ฎฌ๋ ์ด์ ํ ์ ์๋ ๊ธฐ๋ฒ ์ ๋๋ก ์ดํดํ๋ฉด ๋ ๊ฒ ๊ฐ๋ค.
์, ๊ทธ๋ผ DFT์ ๊ฐ์ ์๋ฎฌ๋ ์ด์ ๊ธฐ์ ์ด ์์ด์ ๋ฌผ์ง์ ์ํธ์์ฉ์ ์คํ์ ํ์ง ์๊ณ ๋, ๋๋ต์ ์ผ๋ก ์์ธกํ ์ ์๋ค๊ณ ํ์.
๊ทธ๋ผ ๋๋์ฒด ๋ญ๊ฐ ๋ฌธ์ ์ผ๊น? ์คํ๋ฌผ๋ฆฌ ์ฐ๊ตฌ์๋ค๊ณผ ์ด๋ก ๋ฌผ๋ฆฌ ์ฐ๊ตฌ์๋ค์ด ํ์ ํ์ฌ ์ฌ๋ฌ๊ฐ์ง ๋ฌผ์ง์ ๋ํ ์๋ฎฌ๋ ์ด์ ์ ํ๊ณ , ๊ทธ ์ค์ ๊ด์ฐฎ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ด๋ ํ๋ณด๋ฌผ์ง์ ๋ํ์ฌ ์ค์ ์คํ์ผ๋ก ๊ฒ์ฆํ๋ฉด ๊ฐ๋จํ ๋๋๋ ๊ฒ์ด ์๋๊น? ์ด ์ธ์ ๋ชจ๋ ๋ฌผ์ง์กฐํฉ์ ๋ํ ํ์์ ์ฝ๊ฒ ํ ์ ์์ง ์์๊น?
๊ทธ๋ฌ๋ ์๊ฐ๋ณด๋ค ๊ทธ๋ ๊ฒ ๊ฐ๋จํ ๊ฒ ๊ฐ์ง ์๋ค. ์๋ํ๋ฉด DFT๋ฅผ ๋น๋กฏํ์ฌ ๋ค๋ฅธ ์๋ง์ ๋ฌผ์ง ์๋ฎฌ๋ ์ด์ ๊ธฐ๋ฒ์ ๋จ์ ์, ์ผ๋ฐ์ ์ผ๋ก ์ ํ๋(Accuracy)์ ์ฐ์ฐ์๊ฐ(Computational Time) ์ฌ์ด์ ๊ตํ๊ด๊ณ(Trade-off)๊ฐ ์ฑ๋ฆฝํ๊ธฐ ๋๋ฌธ์ด๋ค. ์ฆ, ํ์ค์ ๋ฌผ๋ฆฌํ์์ ๋ฐ์ํ์ฌ ๋ฌผ์ง์ ์ ํํ๊ฒ ๊ณ์ฐํ๋ ค๊ณ ํ ์๋ก, ๋ ์๊ฒฉํ ์กฐ๊ฑด๋ค์ด ์๊ตฌ๋๋ฉฐ ์ฐ์ฐ์๊ฐ ๋ํ ๊ธ์ฆํ๊ฒ ๋๋ค.
์ฌ๊ธฐ์๋ ์์ธํ ์ธ๊ธํ์ง ์๊ณ ๋์ด๊ฐ์ง๋ง, ๋ฌผ์ง์ ์๋ฎฌ๋ ์ด์ ์ ๊ต์ฅํ ๋ค์ํ ๋ฐฉ์์ผ๋ก ์ฌ์ฉ์๊ฐ ์กฐ์ ํ ์ ์๋ค. DFT ๋ฑ์ ๊ณ์ฐ๊ณผํ๊ธฐ๋ฒ์ ๋ณดํต ์์ฉํ๋ ๋ฌด๋ฃ/์ ๋ฃ ํ๋ ์์ํฌ๊ฐ ์กด์ฌํ์ฌ ์ด๋ฅผ ์ด์ฉํ๋ฉด ํ๋ถ์์ด๋ผ๋ ์๋ฎฌ๋ ์ด์ ์ ํ๋ ๊ฒ์ ์ด๋ ต์ง ์๋ค. ๋ค๋ง, ์๋ง์ ์๋ฎฌ๋ ์ด์ ๊ด๋ จ ๋ณ์์ ์ ํํ ์๋ฏธ๋ฅผ ์๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํด์ํ๊ธฐ ์ํด์ ๋ณต์กํ ๊ณ ์ฒด๋ฌผ๋ฆฌ ์ด๋ก ์ ๊น๊ฒ ๊ณต๋ถํ๋ ๊ฒ์ด ์๊ตฌ๋๋ฏ๋ก, ์ ๋ฌธ๊ฐ ์์ค์ผ๋ก DFT๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํด์๋ ์ง์ ํ๋ จ์ ์ํ ์ค๋ ์ธ์์ด ๊ฑธ๋ฆฐ๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ๊ณ์ฐ๊ณผํ๊ธฐ๋ฒ์ผ๋ก๋ ์ฌ๋ฌ๊ฐ์ง ํ๊ณ(๋ฐฉ๋ํ ์ฐ์ฐ์๊ฐ, ์ด๋ก ์ ๊ฐ์ ๊ณผ ํ์ค์ ๋ถ์ผ์น ๋ฑ)๋ก ์ธํด ๊ฐ๋ฅํ ๋ชจ๋ ๋ฌผ์ง์กฐํฉ์ ๋ํด ๊ณ์ฐํ๋ ๊ฒ์ ๋ถ๊ฐ๋ฅํ๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ์์ญ๋ ๋์ ๊ณ์ฐ๊ณผํ ๋ถ์ผ์ ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ๋ค์ ์ฐจ๊ณก์ฐจ๊ณก ์์ฑ ๋ฐ ์ถ์ ๋์ด ์๋๋ฐ, ์ด๊ฒ์ด ์ค๋๋ ๋ฅ๋ฌ๋์ ๊ณ์ฐ๋ฌผ๋ฆฌํ ๋ถ์ผ์ ์ ์ฉํ ์ ์๋ ์๋๋ ฅ์ด ๋์๋ค.
์ด์ ๋ฅ๋ฌ๋์ ๋ํด ์์ฃผ ๊ฐ๋ตํ ์์๋ณด์.
์ธ์์ ์ผ๋ก ์ง๋ฅ์ ๊ตฌํํ๋ ค๋ ์ธ๊ณต์ง๋ฅ(Artificial Intelligence, AI) ๋ถ์ผ์๋ ๋ค์ํ ํ์๋ถ์ผ๊ฐ ์๋ค. ์๋ฌผ์ ์๋ฆฌ๋ฅผ ๋ชจ๋ฐฉํ์ฌ ์ง๋ฅ์ ๊ตฌํํ๋ ค๋ ๋ถ์ผ๊ฐ ์๊ณ , ์ปดํจํฐ ์์์ ์ง๋ฅ์ ๊ตฌํํ๋ ค๋ ์๋๊ฐ ์์ผ๋ฉฐ, ๋ก๋ณดํฑ์ค(Robotics)์ ๊ฐ์ด ํ๋์จ์ด์ ๋ฐ์ ํ๊ฒ ์ฐ๊ด๋ ๋ถ์ผ๋ ์๋ค.
์ฌ๊ธฐ์ **์ปดํจํฐ(Machine)**์ ์ด์ฉํ์ฌ ์ง๋ฅ์ ๊ตฌํํ๋ ค๋ ๋ถ์ผ๊ฐ ๋ฐ๋ก ์์ฆ ์์ฃผ ์ธ๊ธ๋๋ **๊ธฐ๊ณํ์ต(Machine Learning)**์ด๋ฉฐ, ๊ทธ ์์์๋ ๋ค์ํ ๋ฐฉ์์ ํ์ต ์๊ณ ๋ฆฌ์ฆ๋ค์ด ์์ง๋ง, ์๋ฌผ์ ๋๋๋ฅผ ์์ฃผ ๊ฐ๋ตํ๊ฒ ๋ชจ๋ฐฉํ์ฌ ๋ฐ์ ํ ๋ถ์ผ๊ฐ ๋ฐ๋ก **์ฌ์ธตํ์ต(Deep Learning)**์ด๋ค.
๋๋ถ๋ถ์ ๋ฅ๋ฌ๋ ์์ฉ์ฐ๊ตฌ์์ ๋ฅ๋ฌ๋์ ์ข์ ํจํดํ์ต์ ๋๊ตฌ๋ก ํ์ฉ๋๋ค. ์ฆ, ์ด๋ค ๋ฐ์ดํฐ
๊ทธ๋ผ ์ด์ ๋์น๋ฅผ ์ฑ๋ ์ฌ๋๋ค์ด ์์ ๊ฒ์ด๋ค.
- ์์ญ๋ ๋์ DFT์ ๊ฐ์ ๊ณ์ฐ๊ณผํ ๋ถ์ผ์๋ ๋ฐฉ๋ํ ๊ณ์ฐ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ์ถ์ ๋์ด ์๋ค.
- ์ต๊ทผ ์ฌ์กฐ๋ช ๋ฐ๊ธฐ ์์ํ Deep Learning์ ๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ ์์ผ๋ฉด, ํจํดํ์ต์ ์ํ๋ค.
๊ณ์ฐ๊ณผํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์๋ ์ผ๋ฐ์ ์ผ๋ก ๋ค์๊ณผ ๊ฐ์ ํ์์ผ๋ก ๋ฐ์ดํฐ๊ฐ ์ถ์ ๋์ด ์๋ค.
์ฆ, ๋ฌผ์ง์ ๊ตฌ์กฐ์ ๋ณด๋ฅผ
๊ทธ๋ฆฌ๊ณ ๋ฌผ๋ฆฌํ ๋ถ์ผ์์ ์ด๋ฌํ ๊ฟ ์์ด๋์ด๋ฅผ ๋จผ์ ๋ ์ฌ๋ฆฌ๊ณ ๊ตฌํํ ์ฌ๋์ด ๋ฐ๋ก, ์ด ๊ธ์์ ์ธ๊ธ๋ ๋ ผ๋ฌธ์ ์ ์๋ผ๊ณ ํ ์ ์๋ค. (์ญ์ ๋ฌด์์ด๋ ์ต์ด๊ฐ ์ค์ํ๋ค ใ .ใ )
๋ฌผ๋ก ๋ด๊ฐ ์ง๊ธ๊น์ง ์ค๋ช ํ ๊ฒ์ ๊ต์ฅํ ๋จ์ํํด์ ์ค๋ช ํ ๊ฒ์ด๋ค. ์ค์ ๋ก๋ ์ด๋์ ๋ ๊ณ ์ฒด๋ฌผ๋ฆฌํ์ด๋ ๊ณ์ฐ๋ฌผ๋ฆฌํ์ ๋ํ ์ง์์ด ์์ด์ผ ๊ด๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๊ณ , ๊ทธ ์๋ฏธ๋ฅผ ํด์ํ์ฌ ์ ์ฒ๋ฆฌํ ์ ์์ผ๋ฉฐ, ๋ฅ๋ฌ๋ ๋ถ์ผ์์ GNN์ด๋ผ๊ณ ํ๋.. ์ปดํจํฐ๋น์ ์ด๋ ์์ฐ์ด์ฒ๋ฆฌ์ ๋นํด ๋ฆ๊ฒ ๋ฐ์ ๋ ํน์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ํ ์ง์, ๊ทธ๋ฆฌ๊ณ PyTorch, Tensorflow ๋ฑ์ ๋ฅ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ผ์ ์์ค ์ด์์ผ๋ก ๋ค๋ฃฐ ์ ์์ด์ผ ์์ ์ฐ๊ตฌ๋ฅผ ๊ตฌํํ ์ ์๋ค.
CGCNN ์ดํ ๊ด๋ จ์ฐ๊ตฌ ๋ ผ๋ฌธ์ด ๋ง์ด ๋์์ผ๋ฉฐ, ๋ด๊ฐ ์์ฌ๊ณผ์ ๋์ ํ ์ฐ๊ตฌ๋ ์ด๊ฒ์ ์ฐ์ฅ์ ์์ ์๋ค๊ณ ํ ์ ์๋ค.
๊ทธ๋ผ ์ ๋ฌผ๋ฆฌํ ๋ถ์ผ์์๋ ๊ธฐ๊ณํ์ต์ ์ฌ์ฉํ๋ ๊ฒ์ผ๊น? ์ด์ ๋ํด์๋ ์ฌ๋ฌ๊ฐ์ง ์ด์ ๊ฐ ์๋ค.
๋ค์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด, ๋ฌผ๋ฆฌํ์ ๋ฐ์ ์ ๋ฐ๋ฅธ ์ฐ๊ตฌ์ ํจ๋ฌ๋ค์ ๋ณํ๋ฅผ ์ค๋ช ํ๊ณ ์๋ค. ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ ์ ์๋ฏ์ด, ๊ณผ๊ฑฐ์๋ ๊ฒฝํ์ ํตํด ๊ณผํ์ ์ฌ์ค์ ์ ๋ฆฝํ๋ค. ๊ทธ๋ฆฌ๊ณ ๋ฅด๋ค์์ค ์ดํ ๊ธ๊ฒฉํ ํ๋ฌธ์ ๋ฐ๋ฌ์์ ๊ฐ์ฅ ๋จผ์ ๋น์ ๋ณธ ๋ฌผ๋ฆฌํ์, ์ํ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ผ๋ก ํ์ฌ ๋ง๋ฌผ์ ์๋ฆฌ๋ฅผ ์ค๋ช ํ๋ ๋ฒ์น์ ๋ง๋ค์๋ค. ์ดํ 1900๋ ๋๊ฐ ๋์ด ์ปดํจํฐ์ ๋ฑ์ฅ์ผ๋ก, ์ด์ ๋ณต์กํ ๊ณ์ฐ์ ์ปดํจํฐ์๊ฒ ๋งก๊ธฐ๊ณ ์์คํ ์ด ์ด๋ป๊ฒ ๋ณํํ๋๊ฐ๋ฅผ ๊ด์ฐฐํ ์ ์๊ฒ ๋์๋ค. ๊ทธ๋ฆฌ๊ณ 2000๋ ๋ ์ดํ ๋จธ์ ๋ฌ๋์ ์ฌ๋ฑ์ฅ์ผ๋ก ์ด์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์ฐ๊ตฌ ํจ๋ฌ๋ค์์ด ๊ฐ์ธ๋ฅผ ๋ ๊ธฐ ์์ํ๋ค.
์ ๊ทธ๋ฆผ์ 'from DFT to machine learning' ์ด๋ผ๋ ๋ฆฌ๋ทฐ๋ ผ๋ฌธ์์ ๋ฐ์ทํ ๊ฒ์ด๋ค. ํด๋น ๋ ผ๋ฌธ์ DFT ๋ถ์ผ์์ ์์ฉ์ด ๋ง์์ง ๋จธ์ ๋ฌ๋์ ์ค๋ช ํ๋ ๊ฐ๋จํ ์์ค์ ๋ฆฌ๋ทฐ๋ ผ๋ฌธ์ด๋ค.
๊ทธ๋ฌ๋ ๋ชจ๋ ๋ฌผ๋ฆฌํ ๋ถ์ผ์์ ๋ฅ๋ฌ๋์ ์ฌ์ฉํ ์ ์๋ ๊ฒ์ ์๋๋ค. ์๋ฅผ ๋ค๋ฉด, ์คํ๋ฌผ๋ฆฌํ์ ๋๋ถ๋ถ์ ๋ถ์ผ๋ ์ผ๋จ ๊ฐ๊ฐ์ ์ฐ๊ตฌ์ค์์ ์๋ก ๋ค๋ฅธ ์กฐ๊ฑด์์ ๋ง๋ค์ด์ง ์คํ ๋ฐ์ดํฐ๋ค์ด ์๊ณ , ๊ทธ๊ฒ๋ค์ ๋ณดํต ์ ๋ฐ์ดํฐ๋ฒ ์ด์คํ ๋์ด์์ง ์๋ค. ๋ด๊ฐ ์๊ธฐ๋ก ๋ฌผ๋ฆฌํ์ ์๋ง์ ์ธ๋ถ ๋ถ์ผ์์, ๋ฅ๋ฌ๋ ์ ์ฉ์ด ์๋์ ์ผ๋ก ์ฌ์ด ๊ฒ์ ๊ณ์ฐ๋ฌผ๋ฆฌํ, ์ด๋ก ๋ฌผ๋ฆฌํ ๋ฑ ์ฃผ๋ก ์ด๋ก ๋ฐ ์๋ฎฌ๋ ์ด์ ๊ณผ ๊ด๋ จ๋ ๋ถ์ผ๋ก ํ์ ๋๋ค. ๊ฐ์ฅ ๋ํ์ ์ธ ์์ฉ์ ์ ์๋ฌผ๋ฆฌํ, ๊ณ ์๋์ง(High Energy) ๋ฌผ๋ฆฌํ ๋ถ์ผ์ ๊ด๋ จํ์ฌ ์ ๋ฝ์ ์๋ฌผ๋ฆฌ์ฐ๊ตฌ์(CERN)์์ ๊ฐ๋ํ๋ LHC๊ฐ ์์ฑํ ์ ์๋ฌผ๋ฆฌ ๋ฐ์ดํฐ์ ๋ํ ๋ถ์์ด๋ผ ํ ์์๋ค.
์ฆ, ์ฐ๊ตฌ๊ฐ ๋ํํ๋๊ณ ๋ฐ์ดํฐ๊ฐ ์์์ ธ ๋์ค๋ ํ ์์ ์์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์ฐ๊ตฌ ํจ๋ฌ๋ค์์ด ์ ์ , ๊ธฐ์กด์ ์ด๋ก ์ด๋ ์ง๊ด์ ๊ธฐ๋ฐํ ํจ๋ฌ๋ค์์ ๋ฐ๋ผ์ค๊ณ ์๊ณ , ์ด ๊ณผ์ ์์ ๋จธ์ ๋ฌ๋์ด ํ์ฝํ ์ ์๋ค๋ ๊ฒ์ด๋ค. ์ฌ๊ธฐ์ ํนํ GNN์ ๋ฌผ์ง์ ์์๊ตฌ์กฐ๋ฅผ ๊ฐ์ฅ ์์ฐ์ค๋ฝ๊ฒ ํํํ ์ ์๊ธฐ ๋๋ฌธ์ ํ์ฉ๊ฐ๋ฅ์ฑ์ด ๋ ๋๋ค๊ณ ์๊ฐํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ ์ฌ๋ฃ๊ณผํ ๋ถ์ผ์์ ํน์ ํ ํ์ ๋ฌผ์ฑ์ ๊ฐ๋ ๋ฌผ์ง์ ๋์์ธ์ ์ํด, ์ถฉ๋ถํ ํ์ต๋ ๋ชจ๋ธ์ด ํ์ฉ๋๋ ์์๋ฅผ ๋ณด์ฌ์ค๋ค.
์ ๊ทธ๋ฆผ์ ์ค๋ฅธ์ชฝ๊ณผ ๊ฐ์ด ์๋ง์ ํ๋ณด๋ฌผ์ง์ด ์๋ ์ํฉ์์, ์ถฉ๋ถํ ์ ํ์ต๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ์๋ค๋ฉด ๊ทธ๊ฒ์ ์ฌ๋ฌ ๋ฌผ์ฑ์ ๊ตฌ์กฐ ์ ๋ณด๋ง์ผ๋ก ์์ธกํ ์ ์์ ๊ฒ์ด๋ค. ํ์ต๋ ๋ชจ๋ธ์ ์ผ์ข ์ ํํฐ๋ก ํ์ฉ๋์ด, ์ ํฉํ ๋ฌผ์ฑ์กฐ๊ฑด์ ๊ฐ๋ ์์์ ํ๋ณด๋ฌผ์ง๋ค๋ง์ ์ฑํํ ์ ์๊ฒ ๋๋ค.
Original CGCNN ๋ ผ๋ฌธ์ ๋ณด๋ฉด, ์ ์๋ Materials Project๋ผ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ Perovskite ๋ฌผ์ง๊ตฐ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์์ ๋ชจ๋ธ์ ํ์ตํ๋ค๊ณ ์ธ๊ธํ๊ณ ์๋ค.
Materials Project์ ์ ์ํ๋ฉด 'Harnessing the power of supercomputing and state of the art electronic structure methods, the Materials Project provides open web-based access to computed information on known and predicted materials as well as powerful analysis tools to inspire and design novel materials.' ์ด๋ผ๋ ๋ฌธ๊ตฌ๊ฐ ๋์ ๋ค์ด์จ๋ค.
๊ฐ๋จํ ๋งํ์๋ฉด, ์ง๊ธ๊น์ง ๊ณ์ฐ๋ DFT ๊ธฐ๋ฐ์ ์ ์๊ตฌ์กฐ๊ณ์ฐ ๊ฒฐ๊ณผ๋ค์ ์ ์ฅํ๊ณ ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ด๋ฉฐ ์ฌ๋ฌ๊ฐ์ง ๋ถ์ Tool๊น์ง ์ ๊ณตํ๋ ๊ฒ ๊ฐ๋ค.
๊ธฐ๋ณธ์ ์ธ ์ฌ์ฉ ๋ฐฉ๋ฒ์ ๋งค์ฐ ๊ฐ๋จํ๋ค.
- ํ์๊ฐ์ ํ ๋ก๊ทธ์ธ์ ํ๋ค. Google ์์ด๋๊ฐ ์๋ค๋ฉด ๋ฐ๋ก ๋ก๊ทธ์ธ์ด ๊ฐ๋ฅํ๋ค.
- ๊ฒ์ํ๊ณ ์ถ์ ์ ์ ํ ๋ฌผ์ง์ ํํ์์ ์
๋ ฅํ๋ค. ์๋ฅผ ๋ค๋ฉด,
$\mathrm{SrTiO_3}$ ๋ผ๋ ํ๋ก๋ธ์ค์นด์ดํธ์ ํ ์ข ๋ฅ๋ฅผ ์ ๋ ฅํด๋ณด์.
- ๋ค์๊ณผ ๊ฐ์ด ๋์ผํ ํํ์์ ๊ฐ์ก์ง๋ง, ์ธ๋ถ์ ์ผ๋ก ๋ค๋ฅธ ๋ค์ํ ๊ณ์ฐ๊ฒฐ๊ณผ๋ค์ด ๋์จ๋ค.
-
$\mathrm{mp}-5229$ ID๋ฅผ ๊ฐ๋ ๋ฌผ์ง์ ๋ํด ์๊ณ ์ถ๋ค๋ฉด, ํด๋น ๋ผ์ธ์ ํด๋ฆญํ์. ๊ทธ๋ผ ๋ค์๊ณผ ๊ฐ์ ์๋ฃ๊ฐ ๋์จ๋ค.
๋ฌผ์ง์ Unitcell ๊ตฌ์กฐ์ ์ฌ๋ฌ๊ฐ์ง ๊ด๋ จ ๋ฌผ์ฑ์ ๋ณด๋ค์ด ์๊ฐ๋๊ณ ์๋ค. ๋ฐ์ผ๋ก ์คํฌ๋กค์ ๋ด๋ฆฌ๋ฉด, Density of States(DOS)์ ๊ฐ์ด DFT ๊ณ์ฐ์์ ์์ฃผ ๋ค๋ค์ง๋ ์ค์ํ ์ ๋ณด๋ค๋ ์๊ฐํ๋์ด ์๋ค.
๊ฒฐ๊ตญ ์ด ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ๊ฐ๊ณ ์๋ ๊ฒ์ ์์ญ๋ ๋์ ์ฐ๊ตฌ๋์ด ์จ DFT ๋ถ์ผ์ ๋ค์ํ ๋ฌผ์ง๊ตฌ์กฐ์ ๊ทธ์ ๋์ํ๋ ์ฌ๋ฌ ๋ฌผ์ฑ์ ๋ณด์์ ์ ์ ์๋ค. Materials Project๋ ์ด ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ํด ํ๋ก๊ทธ๋๋ฐ์ ์ผ๋ก ์ ๊ทผํ ์ ์๋ API(Python MPRester)๋ฅผ ์ ๊ณตํ๋ค. ํด๋น API๋ฅผ ์ฌ์ฉํ์ฌ ์์ ์ด ์์ ํ๋ ํ๊ฒฝ์ ๋ฐฉ๋ํ ๋ฌผ์ง ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ฌ ์ ์๊ณ , ๊ทธ๊ฒ๋ค์ ์ ์ฒ๋ฆฌํ๋ฉด์ ์ฐ๊ตฌ์ ์ฒซ ๋จ๊ณ๊ฐ ์์๋๋ค๊ณ ๋ณผ ์ ์๋ค.
์, ์ด์ Materials Project์์ ๋ฐ์ดํฐ๋ฅผ ํ์ํ ๋งํผ ๋ฐ์์๋ค๊ณ ํ์. ๋ณดํต ๋ฌผ๋ฆฌํ ๋ถ์ผ์์ ๋ฅ๋ฌ๋์ ์ ์ฉํ๋ ํ๋ก์ ํธ๋ ์ ๋๋ก ๋ ๋ฐ์ดํฐ๋ฅผ ๊ตฌํ๊ฑฐ๋, ์ง์ ์์ฑํ๋ ๋จ๊ณ์์ ์ ์ฒด ํ๋ก์ ํธ์ ์ ๋ฐ ๊ฐ๊น์ด ์๊ฐ์ด ์๋ชจ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๊ณ์ฐ๊ณผํ ๋ถ์ผ์ ์ํ๋ค์ด ๋ชจ์ธ ์ฐ๊ตฌ๊ทธ๋ฃน์์ ์ข ์ข ๋ฐํ๋๋ ๋ฅ๋ฌ๋ ์์ฉ๋ ผ๋ฌธ๋ค์ ๋ณด๋ฉด, ์ฐ๊ตฌ์๋ค์ด ๊ณ ๋์ ์ด๋ก ์ ์ง์์ ๋์ํ์ฌ ์ค์ ๋ฌผ๋ฆฌํ์์ ๋ชจ๋ฐฉํ ์ ์๋ ์ ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ง์ ๋ง๋ค์ด ์ฌ์ฉํ์์ ๋ณผ ์ ์๋ค. ๊ทธ๋ฐ๋ฐ ํ์ค์ ๋ณต์กํ ๋ฌผ๋ฆฌํ์(Real-world Physics)์ ๋ชจ๋ฐฉํ๋ ์ ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ง๋๋ ๊ฒ์ด ์ฌ์ธ๊น? ๋ณดํต์ ๋งค์ฐ ์ด๋ ต๋ค. ๊ทธ๋ฐ ์๋ฏธ์์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์์ ์ด ์ง์ ์์ฑํ ํ์๊ฐ ์๋ค๋ ๊ฒ์ ๊ต์ฅํ ํ์ด์ด๋ค.
ํ์ง๋ง ๊ทธ๋๋ ์ฌ์ ํ ์ฝ์ง ์๋ค. ๋ชจ๋ ๋ฅ๋ฌ๋ ํ๋ก์ ํธ์์ ๊ฐ์ฅ ๊ท์ฐฎ๊ณ , ์ง๋ฃจํ์ง๋ง, ์ค์ํ๋ฉด ์ ์ฒด ํ๋ก์ ํธ์ ์ง๋ํ ์ํฅ์ ๋ฏธ์ณ์ ๋ฐฉ์ฌํด์๋ ์๋๋.. ์ ์ฒ๋ฆฌ(Preprocessing) ๋จ๊ณ๊ฐ ๋จ์์๋ค.
์ฌ๊ธฐ์๋ ๊ฒฐ์ ๊ตฌ์กฐ(Crystal Structure)๋ฅผ ๊ฐ์ง ๊ณ ์ฒด์ ํ์ ํ์ฌ ์ค๋ช ํ ๊ฒ์ด๋ค. ๊ณ ์ฒด๋ฌผ์ง์ด ๊ณ์ฐ๊ณผํ์ ์ฃผ์ ์ฐ๊ตฌ์ฃผ์ ๊ฐ ๋๋ ์ด์ ๋ ๊ณ ์ฒด์ ์ฃผ๊ธฐ์ ๊ฒฝ๊ณ์กฐ๊ฑด(Periodic Boundary Condition, PBC)์ ์ํด ์ํ์ ์ผ๋ก ๋ถ์์ด ์ฉ์ดํ๊ธฐ ๋๋ฌธ์ด๋ค. ์๋ฅผ ๋ค๋ฉด, ์ฃผ๊ธฐ์ ์ธ ๊ฒฐ์ ๊ตฌ์กฐ์ ๋ํด **ํธ๋ฆฌ์ ๋ณํ(Fourier Transform)**์ ํ๋ฉด, ๊ทธ ๊ฒฐ๊ณผ ๋ํ ์ฃผ๊ธฐ์ ์ฑ์ง์ ๊ฐ๋๋ค. ๋ํ, ์ฃผ๋ณ์ ์ธ์์ ๋ณด๋ฉด ๋๋ถ๋ถ์ ์์ ๋๊ณ ์์ฃผ ํ์ฉ๋๋ ๋ฌผ์ง์ ๊ณ ์ฒดํํ์ธ ๊ฒฝ์ฐ๊ฐ ๋ง์์์ด๊ธฐ๋ ํ๋ค.
์ ์ฒ๋ฆฌ ๊ณผ์ ์ ํฌ๊ฒ 2๋จ๊ณ๋ก ๋๋ ์ ์์ ๊ฒ ๊ฐ๋ค.
๊ตฌ์กฐ ์ ๋ณด์ ๋ํ ์ ์ฒ๋ฆฌ๋ ๊ฒฐ๊ตญ Unitcell ๋จ์์์ ์ ์๋ ์ฌ๋ฌ ์์๋ค์ ์ขํ ์ ๋ณด๋ฅผ ๊ทธ๋ํ(Graph) ๊ตฌ์กฐ๋ก ๋ณํํ๋ ๊ณผ์ ์ด๋ผ๊ณ ํ ์ ์๋ค.
์ฌ๊ธฐ์ Graph๋ ๋ฌด์์ผ๊น? ์ด์ฐ์ํ ๋๋ ์ปดํจํฐ๊ณผํ ๋ถ์ผ์์ ์์ฃผ ์ฐ๊ตฌ๋๋ ๊ทธ๋ํ๋ ๋ ธ๋(Node)์ ์ฃ์ง(Edge)๋ก ์ด๋ฃจ์ด์ง ์๋ฃ๊ตฌ์กฐ์ด๋ค. ์ฌ๊ธฐ์ ๋ ธ๋๋ ์ด๋ค ๊ฐ์ฒด๋ฅผ ์๋ฏธํ๊ณ , ์ฃ์ง๋ ๊ทธ๋ฌํ ๊ฐ์ฒด๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํํํ๋ ๊ฐ๋ ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค. ์ฆ, ์ด ์ธ์์ ์กด์ฌํ๋ ์ฌ๋ฌ ๊ฐ์ฒด ์ฌ์ด์ ์ถ์์ ์ธ ๊ด๊ณ๋ ๋ชจ๋ ๊ทธ๋ํ๋ก ํํ๋ ์ ์๋ค.
๊ทธ๋ผ ๋ฌผ์ง์ ์ ๋ณด๋ฅผ ๊ทธ๋ํ๋ก ๋ณํํ๋ค๋ ๊ฒ์ ์ ํํ ์ด๋ค ์๋ฏธ์ผ๊น? ๋ฌผ์ง์ ๊ตฌ์ฑํ๋ ์์(Atom)๋ฅผ ๋ ธ๋๋ก ํํํ๊ณ , ์์ ์ฌ์ด์ ์ํธ์์ฉ์ ์ฃ์ง๋ก ํํํจ์ ์๋ฏธํ๋ค.
์๋ฅผ ๋ค๋ฉด, ๋ฌผ ๋ถ์
๋ฌผ๋ฆฌํ์ ๊ณต๋ถํ ์ฌ๋๋ค์ด๋ผ๋ฉด, ๊ฒฐ๊ตญ ์ฃ์ง๊ฐ ์๋ฏธํ๋ ๊ฒ์ ์์๊ฐ์ ํ(Force)์ด ์๋๊น? ๋ผ๊ณ ์ถ์ธกํ ๊ฒ์ด๋ค. ์ฌ์ค ๊ทธ ๋ง์ด ๋ง๋ค. ๋ฌธ์ ๋.. ๋ฌผ์ง ์์ ์กด์ฌํ๋ ์จ๊ฐ ์ข ๋ฅ์ ๋ณต์กํ ์ํธ์์ฉ์ ๋ชจ๋ ์ ๋๋ก ๊ณ ๋ คํ์ฌ ์ ์ฒ๋ฆฌํ๊ธฐ๋ ๋งค์ฐ ์ด๋ ต๋ค๋ ๊ฒ์ด๋ค!
์์ ์์ค์์ ์ด๋ฃจ์ด์ง๋ ํ์ ๋ํด ์กฐ๊ธ๋ง ๋ ์ฌ๋ ค๋ณด์. ์ผ๋จ ํ์ ์ข ๋ฅ๊ฐ ์ฌ๋ฌ๊ฐ์ง๊ฐ ์๋ค. ๊ณ ๋ฑํ๊ต๋ ๋ฐฐ์ด ๊ฒ์ ๋์ถฉ ๊ธฐ์ตํด๋ด๋ ๊ณต์ ๊ฒฐํฉ, ์์๊ฒฐํฉ, ๋ฐ๋ฐ๋ฅด๋ฐ์ค ๊ฒฐํฉ ๊ฐ์ ์ฉ์ด๋ค์ด ๋ ์ค๋ฅธ๋ค. ์ ๋๋ก ๋ถ์ํด์ ๋ค์ด๊ฐ์๋ฉด, ์ฌ๋ฌ ์์๋ค์ ์ ์๊ตฌ์กฐ์ธ ์ค๋นํ(Orbital)์ ๋ํด ์์์ผ ํ๊ณ ์ด๋ค ์ฌ์ด์ ์ํธ์์ฉ์ด ์ด๋ป๊ฒ ์ด๋ฃจ์ด์ง๋๊ฐ๋ฅผ ๋ค ๊ณ ๋ คํด์ผ ํ ๊ฒ ๊ฐ๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ๊ฒ์ ์ด๋ก ์ ์ผ๋ก ๋งค์ฐ ์ด๋ ต๋ค.
๋ฐ๋ผ์ CGCNN ์ ์๋ ํ์ด ์๋๋ผ **๋ฐฉํฅ์ ๋ฌด๊ดํ ๊ฑฐ๋ฆฌ(Distance)**๋ฅผ ์ฃ์ง์ ์ฃผ์ ์ ๋ณด๋ก ํํํ๋ค. ๋ ผ๋ฌธ์ ๋ ํผ๋ฐ์ค๋ฅผ ๊ฑฐ์ฌ๋ฌ ์ฝ์ด๊ฐ๋ค๋ณด๋ฉด, ๊ทธ ์ ๋ถํฐ ๊ด๋ จ๋ถ์ผ์ ์ฐ๊ตฌ์๋ค์ด ๊ณตํต์ ์ผ๋ก ์ด๋ฌํ ๋ฐฉ์์ ์ฌ์ฉํ๋ ๊ฒ ๊ฐ๋ค. ์ฆ, ๋ฌผ์ง ๋ด๋ถ์ ์์ ์ฌ์ด์ ์๋ฌด๋ฆฌ ๋ณต์กํ ์ํธ์์ฉ์ด ์๋ค๊ณ ํ ์ง๋ผ๋, ๊ฒฐ๊ตญ์ ๊ทธ๊ฒ์ ์์๊ฐ์ ๋๊ฑฐ๋ ๋ฐ์ด๋ด๋ ํ์ผ๋ก ํํ๋ ๊ฒ์ด๊ณ , ๊ทธ ์ํฅ๋ ฅ์ ์ต์ข ์ ์ผ๋ก ๊ฑฐ๋ฆฌ๋ก ํํ๋ ๊ฒ์ด๋ค! ๋ผ๊ณ ํด์ํ๋ ๊ด์ ์ด๋ค. ์ด๊ฒ์ ์ ์ฒ๋ฆฌ ๋ฌธ์ ๋ฅผ ์๋นํ ์ฝ๊ฒ ๋ง๋ค์ด์ฃผ๋ ๊ฑฐ์ ์ ์ผํ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ณธ๋ค.
Materials Project์์ ๋ฐ์์ค๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๊ธฐ๋ง ํ๋ค๋ฉด, ๋ฌผ์ฑ ์ ๋ณด์ ๋ํ ์ ์ฒ๋ฆฌ๋ ์ฌ์ค ๊ต์ฅํ ๊ฐ๋จํ๋ค. ๋ง์ฝ ์ง์ DFT ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ณ , ๊ฑฐ๊ธฐ์ ํน์ ํ ๋ฌผ์ฑ์ ์ถ์ถํ๋ค๋ฉด ์กฐ๊ธ ๊ท์ฐฎ์ ๊ณผ์ ์ด ์ถ๊ฐ๋๋ค.
๋ค์๊ณผ ๊ฐ์ด
์ฌ๊ธฐ์ ๋ฌผ์ฑ
-
$Y$ ๋ถํฌ์ ํ๊ท ์ ๊ตฌํ๋ค : Y.mean -
$Y$ ๋ถํฌ์ ํ์คํธ์ฐจ๋ฅผ ๊ตฌํ๋ค : Y.std - ์ ๊ทํํ๋ค : Y = (Y - Y.mean) / Y.std
์ด๋ ๊ฒ ์ ๊ทํ๋ฅผ ํ๋ ์ด์ ๋, ์ต์ข
์ ์ผ๋ก ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ์ํํ๊ฒ ๋ Regression ๋ฌธ์ ์์ ๊ฐ์ ๋ถํฌ๊ฐ ๋๊ฒ ํผ์ณ์ ธ ์๋ ๊ฒ๋ณด๋ค ์ข๊ฒ ๋ชจ์ฌ์๋ ํธ์ด ๋ ์ฝ๊ธฐ ๋๋ฌธ์ผ ๊ฒ์ด๋ค. Classification ๋ฌธ์ ์ ๋ฌ๋ฆฌ, Regression ๋ฌธ์ ์์๋ ๊ฐ๊ฐ์
๋ชจ๋ธ๋ง์ ์ค๋ช ํ๊ธฐ ์ ์ ์ ์ ๋ฅ๋ฌ๋์ ๋ํด ๋งํ์๋ฉด, ์ผ๋ฐ์ธ๋ค์๊ฒ ๋ฅ๋ฌ๋์ 2016๋ ์ํ๊ณ ์ ์ด์ธ๋์ ๋๊ตญ์ ํตํด ์๋ ค์ง๊ฒ ๋์๋ค๊ณ ๋ณผ ์ ์๋ค. ๋ฅ๋ฌ๋ ์ดํ ์ด์ ์๋ ๊พธ์คํ ํด๋น ๋ถ์ผ์ ์ฐ๊ตฌ์๋ค์ด ๋ ผ๋ฌธ์ ๋ฐํํด์์ง๋ง, ๋ค๋ฅธ ๋ถ์ผ์์๊น์ง ๋ฅ๋ฌ๋ ์์ฉ๋ ผ๋ฌธ์ด ์์์ง ๊ฒ์ ํ์คํ ์ํ๊ณ ์ดํ, TensorFlow์ PyTorch ๋ฑ ๊ฐ์ข ํ๋ ์์ํฌ์ ๋ฐ์ ์ด ์ํฅ์ ์ฃผ์๋ค๊ณ ์๊ฐํ๋ค. ์ธ๊ณต์ง๋ฅ ๋ถ์ผ๋ฅผ ์๋๋ถํฐ ๊ณต๋ถํ๋ ํน์ ์ ๊ณต๋ถ์ผ(ํต๊ณํ, ์ปดํจํฐ๊ณตํ ๋ฑ)์ ์ ์ธํ๋ฉด, ๋๋ถ๋ถ์ ๋น์ ๊ณต์ ํ๋ถ์๋ค์ด ๋จธ์ ๋ฌ๋์ ๊ณต๋ถํ๊ฒ ๋๋ฉด ๋์ฒด์ ์ผ๋ก ๋ค์๊ณผ ๊ฐ์ ์์๋ก ํ์ต์ ๊ฒฝํํ ๊ฒ ๊ฐ๋ค.
- ์ผ๋ฐ์ ์ธ ์ ํ๋ฐ์ดํฐ์ ๋ํด ์ ์ฉ๋ ์ ์๋ ๊ณ ์ ์ ์ธ ํต๊ณ ๊ธฐ๋ฐ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฐฐ์ฐ๊ณ
- ๋ค์ํ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ๋ค ์ค์์, ํน๋ณํ ์ ๊ฒฝ๋ง ํํ๋ก ์๋ํ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ํด ์๊ฒ ๋ ๊ฒ์ด๊ณ
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต๊ณผ์ , Backpropagation ๊ฐ์ ๊ฒ๋ค์ ๋ฐฐ์ฐ๊ณ ๋์ CNN, RNN ๋ฑ์ ๋ํด ์๊ฒ ๋ ๊ฒ์ด๋ค.
- CNN ๊ธฐ๋ฐ์ ๋ชจ๋ธ์ด ๋ฐ์ ํ์ฌ ์ปดํจํฐ๋น์ (Computer Vision, CV) ๋ถ์ผ์์ ๋ฐ์ ํ๊ณ , RNN/LSTM ๋ฑ์ ์ํ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ด ์์ฐ์ด์ฒ๋ฆฌ(Natural Language Processing, NLP) ๋ถ์ผ์์ Bert, Transformer, GPT2 ๋ฑ์ผ๋ก ๋ฐ์ ๋๊ณ ์์ผ๋ฉฐ..
- ๋งจ๋ ๋ชจ๋ธ์ ํ๋ จ์์ผ ์์ธกํ๋ Supervised Learning์ ์ง๋ ค์ Unsupervised Learning์ ํด๋ฌ์คํฐ๋ง์ ์๊ฒ ๋๊ณ
- ์๋ก์ด ๊ฒ์ ๋ชฉ๋ง๋ผ GAN๊ณผ ๊ฐ์ ์์ฑ๋ชจ๋ธ๋ง์ด๋ ๊ฐํํ์ต(Reinforcement Learning)์ ๋์ ๋๋ฆฌ๊ฒ ๋ ๊ฒ์ด๋ค.
2010๋ ์ฏค๋ถํฐ CV ๋ถ์ผ์ CNN ๋ชจ๋ธ์ด ๊ธ๊ฒฉํ ๋ฐ์ ํ๋ค๊ฐ ์กฐ๊ธ ์ ์ฒด๋๋ ๋๋์ด ์๊ณ , ์ดํ์ ์์ฐ์ด์ฒ๋ฆฌ ๋ถ์ผ์์ ํญ๋ฐ์ ์ธ ๋ฐ์ ์ด ์๋ค๊ฐ ์์ฆ์ ๋ค์ ์ ์ ํด์ง ๋๋์ด ์๋ค. (์ด๋๊น์ง๋ ์ผ๋ฐ์ธ ์ ์ฅ์์) ๊ทธ๋ฌ๋ค๊ฐ 2020๋ ์ฏค๋ถํฐ, (์ค์ ๋ก๋ 2017๋ ์ด์ ๋ถํฐ๋ ๋ ผ๋ฌธ์ด ๋์์ง๋ง) ์ธ๊ตญ ๋ฅ๋ฌ๋ ์ปค๋ฎค๋ํฐ์์ ์์ฃผ ์ธ๊ธ๋๊ธฐ ์์ํ๋ ์๋ก์ด ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ด ์์๋๋ฐ ๊ทธ๊ฒ์ด ๋ฐ๋ก GNN ์ด์๋ค. ์ด์ ๋ถํฐ GNN์ ๋ํด ์์๋ณด์.
์ ๊ฒฝ๋ง์ ๋ํด ๊ณต๋ถํ ์ฌ๋๋ค์ด๋ผ๋ฉด, ์ด๋ฏธ์ง์ ํนํ๋ CNN์ด๋ ์์ฐ์ด์ฒ๋ฆฌ์์ ์์ฃผ ์ฐ์ด๋ RNN, LSTM ๋ฑ์ ๋ชจ๋ธ์ ์ ์ ๊ฒ์ด๋ค. ๊ทธ๋ฐ๋ฐ ์ด๋ฐ ๋ชจ๋ธ๋ค์๋ ๋ช ๊ฐ์ง ์ ์ ๊ฐ ์์๋ค. ์ด๋ฏธ์ง์ ์์ฐ์ด๋ ๋ชจ๋ ๋น์ ํ ๋ฐ์ดํฐ์ด์ง๋ง, ๊ฒฐ๊ตญ ํน์ ํ ๊ณต๊ฐ์์ ํ๋์ ๋ฒกํฐ๋ก ํํ๋ ์ ์์๋ค. ์ด๊ฒ์ด ๋ถ๊ฐ๋ฅํ๋ค๋ฉด, ์์ฐ์ด์ฒ๋ฆฌ ๋ถ์ผ์ Word Embedding์ ์์ ์ ์๋ค.
๊ทธ๋ฐ๋ฐ ์ฐ๋ฆฌ๊ฐ ์ด์ ๋ถํฐ ๋ค๋ฃจ๋ ๋ฐ์ดํฐ๋ ์กฐ๊ธ ๋ค๋ฅด๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๋ฌผ์ง์ ๊ตฌ์กฐ ์ ๋ณด๋ ๊ทธ๋ํ๋ก ํํ๋๋ ๊ฒ์ด ๊ฐ์ฅ ์์ฐ์ค๋ฝ๋ค. ๋ฐ๋ผ์ ๊ทธ ์ ๋ณด๋ฅผ ํ์ตํด์ผ ํ ์ฐ๋ฆฌ์ ๋ชจ๋ธ ๋ํ, ๊ทธ๋ํ ์ ๋ณด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์๋ค์ผ ์ ์์ด์ผ ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ฌ๊ธฐ์ ์กฐ๊ธ ๋ฌธ์ ๊ฐ ์๊ธด๋ค.
Q. ๊ทธ๋ํ๋ฅผ ๋ฒกํฐ๋ก ํํํ ์ ์๋๊ฐ?
๋๋ถ๋ถ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์๋ ๊ณตํต์ ์ธ ๊ฐ์ ์ด ์๋ค. ๋ฐ๋ก ๋ฐ์ดํฐ์ Feature๊ฐ ์๋ก ๋ ๋ฆฝ์ด๋ผ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ ๊ทธ๋ํ๋ ์ด์ ๋ค๋ฅด๋ค. ๊ทธ๋ํ๋ ๋ณธ์ง์ ์ผ๋ก **Irregular domain (Non-euclidean space)**์ ์กด์ฌํ๋ฉฐ, ๋ฐ์ดํฐ์ Feature ์ฌ์ด์ **์ถ์์ ์ธ ๊ด๊ณ(Relationship)**๊ฐ ์กด์ฌํ๋ค. ๊ทธ๋ฌ๋ฏ๋ก ์ด๋ฌํ ๊ด๊ณ๋ฅผ ์ ํฌ์ฐฉํ๋ ํ์ต ๋ฐฉ๋ฒ์ด ํ์ํ๋ค. ๊ธฐ์กด์ CNNM, RNN ๊ธฐ๋ฐ์ ๋ชจ๋ธ์ ์ด๋ฌํ ๊ธฐ๋ฅ์ด ์์์ผ๋ฏ๋ก, ๊ทธ๋ํ ์ ๋ณด ์์ฒด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์๋ค์ผ ์ ์๋ GNN ๋ชจ๋ธ์ด ๋ฐ์ ํ๊ฒ ๋์๋ค. GNN์ ๋ง ๊ทธ๋๋ก ๊ทธ๋ํ๋ผ๋ ์๋ฃ๊ตฌ์กฐ ์์ฒด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์๋ค์ผ ์ ์๋ค. ๊ทธ๋ํ๋ผ๋ ๋ฒ์ฉ์ ์ธ ์๋ฃ๊ตฌ์กฐ๋ฅผ ์ฒ๋ฆฌํ๋ค๋ ์ ์์ ๊ธฐ์กด์ ์ ๊ฒฝ๋ง๋ค์ด ๋ค๋ฃจ๋ ๋ฐ์ดํฐ์๋ ์ฝ๊ฐ์ ์ฐจ์ด๊ฐ ๋ฐ์ํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ ์ผ์ชฝ๊ณผ ์ค๋ฅธ์ชฝ์ ๊ฐ๊ฐ ์ด๋ฏธ์ง๋ฅผ ํ์ตํ๋ CNN, ์์ฐ์ด๋ฅผ ํ์ตํ๋ RNN์ ๊ฐ๋จํ ๊ทธ๋ฆผ์ ๋ณด์ฌ์ค๋ค.
์ฌ๊ธฐ์ ์ค์ํ ๊ฒ์, ์ด๋ฏธ์ง์ ์์ฐ์ด ๋ชจ๋ ๋จ์ผ ๋ฐ์ดํฐ์ ๊ด์ ์์ ๋ฒกํฐ๋ก ํํ๋ ์ ์๋ค๋ ๊ฒ์ด๋ค. ์ด๋ฏธ์ง๋ฅผ ์๋ก ๋ค์ด๋ณด์. ์ด๋ฏธ์ง๋ Convolution๊ณผ Pooling ์ธต์ ๋ฐ๋ณต์ ์ผ๋ก ํต๊ณผํ๊ณ ๋น์ ํํ๋๋ฉด์ ์ต์ข ์ ์ผ๋ก ์ด๋ฏธ์ง์ ๊ธฐํํ์ ์ ๋ณด๋ฅผ ์ ํํํ๋ ํน์ฑ๋ฒกํฐ๋ก ๋ณํ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ ๋ฒกํฐ๊ฐ FCL์ ์ ๋ ฅ๋๋ฉด์ ํน์ ํ ๋ผ๋ฒจ์ ์์ธกํ๋๋ก ํ์ต๋๋ค.
์์ฐ์ด์ ๊ฒฝ์ฐ๋ ์ด๋จ๊น? ๋ณดํต ์์ฐ์ด์ฒ๋ฆฌ ๋ถ์ผ์์ ํ ์คํธ๋ ๋จ์ด(Word)์ Sequence๋ก RNN์ ์ ๋ ฅ๋๋ค. ์ด ๋ ๋จ์ด๋ค์ ๋จ์ด์ ํน์ฑ์ ์ ํํํ๋ Word Embedding (ex. Skip-gram, C-BOW etc.) ์๊ณ ๋ฆฌ์ฆ์ ์ํด dense vector representation์ผ๋ก ๋ณํ๋์ด ์ ๋ ฅ๋๋๋ฐ, ์ด๋ ๊ณง RNN์ ์ ๋ ฅ๋๋ ๊ฐ๋ณ ์ ๋ ฅ์ด ๋ฒกํฐ๋ก ํํ๋จ์ ๋ปํ๋ค.
์ด๋ ๊ฒ ์ด๋ค ๋ฐ์ดํฐ๊ฐ ํ๋์ ๋ฐ์ดํฐํฌ์ธํธ(๋ฒกํฐ)๋ก ์๋ก ์ง๊ตํ๋ ์ถ์ ๊ฐ๋ ๋ฒกํฐ๊ณต๊ฐ์ ํ ์์๋ก ํํ๋ ์ ์๋ค๋ฉด, ๊ทธ๊ฒ์ ๋ณดํต Euclidean space์ ์กด์ฌํ๋ค๊ณ ํ๋ค. ๋ค์ ๊ทธ๋ฆผ์ ๊ทธ๋ฌํ ๊ณต๊ฐ์ ์์๋ฅผ ๋ณด์ฌ์ค๋ค.
CNN, RNN ๊ณ์ด์ ๋ชจ๋ธ์ ์ด์ ์ธ๋์ ๊ณ ์ ์ ์ธ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ค์ด ์ ํ๋ฐ์ดํฐ๋ฅผ ์ ๋ค๋ฃจ์๋ ๊ฒ์ ๋์ด, ๋น์ ํ๋ฐ์ดํฐ์ธ ์ด๋ฏธ์ง์ ์์ฐ์ด๋ฅผ ์ ํ์ตํ๋ค๋ ๊ฐ์ ์ผ๋ก ๋ ์ฌ๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ๋ชจ๋ธ์ ๋ชจ๋ ์ ๋ ฅ ๋ฐ์ดํฐ๊ฐ ์ ํด๋ฆฌ๋์ธ ๊ณต๊ฐ์ ์กด์ฌํ๋ค๋ ๊ฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ์ฑ๋ฆฝ๋์๋ค.
๊ทธ๋ผ GNN์ ๋ญ๊ฐ ๋ค๋ฅผ๊น? ์ฐ์ ๊ทธ๋ํ์ ๋ํด ์์๋ณด์.
๊ทธ๋ํ๋ ์ ์ (Vertex, Node)๊ณผ ๊ฐ์ (Link, Edge)์ ์งํฉ์ผ๋ก ํํ๋๋ ๋ฒ์ฉ์ ์ธ ์๋ฃ๊ตฌ์กฐ์ด๋ค. ์ฌ๊ธฐ์ ๋ ธ๋๋ ์ด๋ค ๊ฐ์ฒด๋ค์ ์ ๋ณด๋ฅผ ๋ํ๋ด๊ณ , ์ฃ์ง๋ ๊ทธ๋ฌํ ๊ฐ์ฒด๋ค ์ฌ์ด์ ์ถ์์ ์ธ ๊ด๊ณ๋ฅผ ํํํ๋ ๊ฐ๋ ์ผ๋ก ์ดํดํ๋ฉด ์ ์ ํ๋ค.
๊ทธ๋ํ์ ์ฃ์ง๊ฐ ๋ฐฉํฅ์ฑ์ด ์์ผ๋ฉด Directed, ์์ผ๋ฉด Undirected ๊ทธ๋ํ๋ผ๊ณ ํ๋ค. ๋ง์ฝ ์ฃ์ง๊ฐ ๋จ์ํ ์ฐ๊ฒฐ์ฑ์ ํํํ๋ ๊ฒ ์ด์์ผ๋ก ํน์ํ ๊ฐ์ค์น๊ฐ ํ ๋น๋์ด ์๋ค๋ฉด Weighted, ์๋ค๋ฉด Unweighted ๊ทธ๋ํ๋ผ๊ณ ํ๋ค.
๊ทธ๋ํ๋ก ํํ๋ ์ ์๋ ๊ตฌ์กฐ๋ ์ด๋์๋ ์๋ค. ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ์ฌ๋ฌ ์์์ ์กฐํฉ์ผ๋ก ๊ตฌ์ฑ๋๋ ๋ถ์๋ ๊ทธ ์์ฒด๋ก ๊ทธ๋ํ์ด๋ค. ์์๋ ๋ ธ๋๋ก ํํ๋๊ณ , ์์ ๊ฐ ๊ฒฐํฉ์ ์ฃ์ง๋ก ํํ๋ ์ ์๋ค. ์ฑ๊ณผ ๊ฐ์ ๊ฑด์ถ๋ฌผ์ด ์๋ค๋ฉด, ๊ฑด์ถ๋ฌผ์ ๊ฐ๋ณ ํ์ธ ๋ ๋ ธ๋๋ก ํํ๋๊ณ , ํ์ธ ๊ฐ์ ๊ฒฐํฉ์ ์ฃ์ง๋ก ํํ๋ ์ ์๋ค. ์ธํฐ๋ท์ ์ด๋จ๊น? ์ธํฐ๋ท์ ์๋ง์ HTML ํ์ด์ง๋ค์ด ํ์ดํผ๋งํฌ๋ฅผ ํตํด ์ฐ๊ฒฐ๋์ด ์๋ค. ๊ฐ ํ์ด์ง๋ ๋ ธ๋๋ก ํํ๋๊ณ , ํ์ดํผ๋งํฌ๋ ์ฃ์ง๋ก ํํ๋ ์ ์๋ค.
์ฐ๋ฆฌ๊ฐ ๋ฐฐ์ฐ๊ฒ ๋ GNN์ ์ด๋ฌํ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ํ์ตํด์ผ ํ๋ค.
๊ทธ๋ผ ์ด์ ๋ถํฐ ์ฝ๊ฐ ์ด๋ ค์ด ๋ด์ฉ์ ๋ฐฐ์๋ณด์. ์ง๊ธ๋ถํฐ ์ค๋ช ํ ๋ด์ฉ์ 2009๋ ์ ๋ฐํ๋์๋ ํ๋์ Graph Neural Network ๋ ผ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค. ํด๋น ๋ ผ๋ฌธ์์ ์ผ๋ถ ์ด๋ฏธ์ง์ ์์์ ๋ค์๊ณผ ๊ฐ์ด ๋ฐ์ทํ์๋ค.
์ ๊ทธ๋ฆผ์์ ์ผ์ชฝ์ ๋จผ์ ๋ณด์. ๊ทธ๋ฆผ๊ณผ ๊ฐ์ ์์์ ๊ทธ๋ํ ๊ตฌ์กฐ๊ฐ ์ฃผ์ด์ก์ ๋, ์ฐ๋ฆฌ๋ 1๋ฒ ๋
ธ๋์ธ
๊ทธ๋ฆผ์ ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ ์์์ด ์ ํ์๋ค.
์ฌ๊ธฐ์
๊ฐ์๊ธฐ ์ฌ๋ฌ ์์์ด ๋์์ ์ด๋ ต๊ฒ ๋๊ปด์ง ์๋ ์์ง๋ง, ์ฌ์ค ํต์ฌ๋ด์ฉ์ ๊ฐ๋จํ๋ค.
์ง๊ธ๋ถํฐ ์ฐ๋ฆฌ๋
๋๋ฌธ์๋ก ํํ๋ ์์์ ๊ฐ๋ณ ๋ ธ๋๊ฐ ์๋๋ผ ๊ทธ๋ํ ์ ์ฒด์ Globalํ ๊ด์ ์์ ์ฐ์ฐ์ ํ๋ ฌ๋ก ํํํ ๊ฒ์ผ ๋ฟ์ด๋ค.
์ด์ ๋ฐฉ๊ธ ๋ฐฐ์ด
๋ค์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด, ์ผ์ชฝ์ 4๊ฐ์ ๋
ธ๋์ 4๊ฐ์ ์ฃ์ง๋ก ๊ตฌ์ฑ๋ ์์ ๊ทธ๋ํ๊ฐ ์๋ค. ์ฃผ์ด์ง ๊ทธ๋ํ์ ๋ํด ๋ฐฉ๊ธ ๋ฐฐ์ ๋ Local Transition Function๊ณผ Local Output Function์ ์์ฉ์ ๊ณ์ฐ ๊ทธ๋ํ๋ก ํํํ๋ฉด ์ค๊ฐ์ ๋์์ด ๋๋ค. ์ ๋
ผ๋ฌธ์์
์ด์ ์์์ ๋ณธ ๊ทธ๋ฆผ์ ๋ค์ ํ๋ฒ ๋ณํํด๋ณด์. ๋ค์ ๊ทธ๋ฆผ์์ ์ผ์ชฝ์ ์์ ์ํฉ์ ์กฐ๊ธ ๋ ๋ณด๊ธฐ ์ข์ ํํ๋ก ์ ๋ฆฌํ ๊ฒ์ด๋ค. ์ด์
๊ทธ๋ฐ๋ฐ ์ด ๋ชจ์. ์ด๋์ ๋ณธ ๊ฒ ๊ฐ์ง ์์๊ฐ?
์์ ์ค๋ช
ํ๋, ์์ฐ์ด์ฒ๋ฆฌ ๋ถ์ผ์์ ์์ฃผ ์ฌ์ฉ๋๋ RNN์ ์ฃผ์ด์ง ์
๋ ฅ์ ๋ํด Recurrentํ๊ฒ ๋ฐ๋ณต๋ ์ฐ์ฐ์ ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ ๋
ผ๋ฌธ์์ Embedding Network๋ก ํํ๋๋
์ฌ์ค ์ฌ๊ธฐ์ ๋ ผ๋ฌธ์ ์ฃผ์ฅ์ด ๋ชจ๋ ๋์๋ค.
๊ฒฐ๊ตญ ๋ ผ๋ฌธ์ ์ฃผ์ฅ์, Graph Neural Network์์ Graph์ ๋ ธ๋ ์ ๋ณด๋ฅผ ์ ๋ฐ์ดํธํ๊ธฐ ์ํ ์ฐ์ฐ์ด, ์ด๋ฏธ ์ฌ์ฉ๋๊ณ ์๋ RNN์ Generalization์ผ๋ก ๋ณผ ์ ์๋ค๋ ๊ฒ์ด๋ค. RNN์ ์ด๋ฏธ **Back-Propagation-Through-Time (BPTT)**์ ์ํด ํ์ต ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ฆฝ๋์ด ์์ผ๋, ๋์ผํ ์๋ฆฌ์ ์ํด Graph Neural Network๋ ํ์ต๊ฐ๋ฅํ ๋ชจ๋ธ๋ก ๊ธฐ๋ฅํ ์ ์๋ค!
2009๋ ์ ๋ฐํ๋ ์ด ๋ ผ๋ฌธ์, Graph Neural Network๊ฐ RNN์ Generalization์ผ๋ก์ ํ์ต์ด ๊ฐ๋ฅํ๋ค๋ ์ฌ์ค์ ์ง๊ด์ ์ผ๋ก ์ค๋ช ํ๊ณ , ๋ท ๋ถ๋ถ์์๋ ์ ๋์ ์ธ ์ฆ๋ช ์ผ๋ก ๋ด์ฉ์ ์ ๊ฐํ๊ณ ์๋ค. ์ํ์ ์ธ ์ฆ๋ช ์ ๋๋ถ๋ถ ๋ฏธ๋ถ์ ์ฐ์๋ฒ์น๊ณผ ๋ชฉ์ ํจ์์ ์ต์ํ ๊ณผ์ ์ ์ง๋ฃจํ๊ฒ ์ค๋ช ํ ๊ฒ์ด๊ธฐ์ ์ฌ๊ธฐ์๋ ๋์ด๊ฐ๋๋ก ํ๋ค.
์ด์ ๋ถํฐ ์ข ๋ ๋ณธ๊ฒฉ์ ์ผ๋ก GNN์ ๋ํด ์์๋ณด์. GNN์ด ํ์ต๊ฐ๋ฅํ๋ค๋ ์ฌ์ค์ด ์ฆ๋ช ๋ ์ดํ๋ก, ๊ธฐ์กด์ Convolution๊ณผ Recurrence ์ฐ์ฐ์ ๊ทธ๋ํ ๋๋ฉ์ธ์ ๋ํด ์ผ๋ฐํํ๋ ค๋ ๋ง์ ์ฐ๊ตฌ๋ค์ด ๋ฐํ๋์๋ค. ๊ต์ฅํ ๋ง์ ๋ ผ๋ฌธ๋ค์ด ์์ง๋ง, ๊ทธ ์ค์์ ๋ํ์ ์ธ ํ ์ฐ๊ตฌ๋ฅผ ์ค๋ช ํ๋ ค๊ณ ํ๋ค. ์ค๋ช ์ ๊ธฐ๋ฐ์ด ๋๋ ๋ ผ๋ฌธ์ 2017๋ , Kipf & Welling์ ์ํด ๋ฐํ๋์๋ Semi-Supervised Node Classification ์ํฉ์์์ Graph Convolution Network (GCN) ์ด๋ค.
๋ค์ ๊ทธ๋ฆผ์ ๋ณด์. ์ฐ๋ฆฌ์ GNN์ด ํด์ผ ํ๋ ๊ฒ์ ๋
ธ๋์ ์ ๋ณด๋ฅผ ์ฌ๋ฌ ์๋์ธต์ ํตํด ์
๋ฐ์ดํธ์ํค๊ณ , ๊ฐ๋ณ ๋
ธ๋์ ์ ๋ณด
์ด๋ฏธ์ง๋ฅผ ํ์ตํ๊ธฐ ์ํด CNN์์ ๊ตญ์์ ์ธ ์์ญ์ ์ฌ๋ฌ Pixel๋ค์ ๊ด๊ณ๋ฅผ ํ์ตํ๋ ค ํ๋ ๊ฒ์ฒ๋ผ, ์ด์ ๋ ๊ทธ๋ํ์์ ํน์ ํ ๋ ธ๋์ ๊ทธ ์ฃผ๋ณ ์ด์๋ ธ๋๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํ์ตํ๋ ค๊ณ ํ๋ค. ์ฆ, CNN์์ ์ฌ์ฉ๋์๋ Spatial Filter Convolution์ ๊ฐ๋ ์ Graph๋ก ํ์ฅํ ๊ฒ์ด๋ผ ํ ์ ์๋ค.
์ด๋ฌํ Graph Convolution์ ์ํด ์ถฉ๋ถํ ์ ๋ฐ์ดํธ๋ ๊ทธ๋ํ๋ Graph-level Task ์ํฉ์์ Readout(๋๋ Graph Pooling) ๋ ์ด์ด๋ฅผ ํต๊ณผํ๋ฉฐ, ๊ทธ๋ํ ๋ ๋ฒจ์ vector representation์ผ๋ก ๋ณํ๋ ์ ์๋ค. ์ดํ์๋ ํ๋ฒํ๊ฒ MLP ๋ฑ์ ์ ๋ ฅ๋์ด ํ์ต์ ํ ์ ์๊ฒ ๋๋ค.
๊ทธ๋ผ, Graph Convolution ์ด๋ผ๋ ์ฐ์ฐ์ ์ด์ง ์์๋ณด์. ๋ค์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด 8๊ฐ์ ๋ ธ๋์ 7๊ฐ์ ์ฃ์ง๋ก ๊ตฌ์ฑ๋ ๊ฐ๋จํ ๊ทธ๋ํ๊ฐ ์๋ค๊ณ ํ์.
๊ทธ๋ํ ์์์ ๋
ธ๋ ์ฌ์ด์ ์ฐ๊ฒฐ์ ๋ณด๋ ์ธ์ ํ๋ ฌ(Adjacency Matrix)๋ก ๋ถ๋ฆฌ๋
์ด์ ์ ๊ฒฝ๋ง์ ํ ์ธต์ ๋์๋๋ Trainable Weight Matrix
์ฌ๊ธฐ์
๊ฒฐ๊ตญ ๋ค์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด (์ฐ๋ฆฌ๊ฐ 7๋ฒ ๋ ธ๋์ ์ฃผ๋ชฉํ๋ค๊ณ ํ๋ฉด), 7๋ฒ ๋ ธ๋๋ ์ฃผ๋ณ์ ์ฐ๊ฒฐ๋์ด ์๋ 3, 4, 6, 8๋ฒ ๋ ธ๋๋ก๋ถํฐ ๊ฐ์ค์นํ๋ ์ ๋ณด(Message)๋ฅผ ๋ฐ์, ์์์ ๋ฐฉ์์ผ๋ก ์ ๋ฐ์ดํธ๋๋ค.
๊ฒฐ๊ตญ GNN์ ๋๋ต์ ์ธ ๊ตฌ์กฐ๋ ๋ค์ ๊ทธ๋ฆผ์ฒ๋ผ ํํ๋ ์ ์๋ค.
์ฆ, Input์ผ๋ก ๋ค์ด์จ ๊ทธ๋ํ ์ ๋ณด๋ Graph Convolution Layer๋ฅผ ์ฌ๋ฌ๋ฒ ์ง๋๋ฉด์ ๋งค๋ฒ ์ ๋ฐ์ดํธ๋๊ณ , ์ํฉ์ ๋ฐ๋ผ ํ์ํ๋ค๋ฉด Readout ์ธต์ ํต๊ณผํ๋ฉฐ Graph representation์ ๋ฒกํฐ๊ฐ ๋ ์ ์๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ๋ฒกํฐ๋ ์ด์ ๋ฌธ์ ์ํฉ์ ์ ํฉํ ๊ทธ๋ํ ์ ๋ณด๋ฅผ ์ ํํํ ๊ฒ์ด๋ฏ๋ก, MLP์ ๊ฐ์ ํ๋ฒํ Feed-forward Neural Network์ ์ ๋ ฅ๋์ด ํ์ต๋ ์ ์๋ค.
๋
ผ๋ฌธ๋ง๋ค ์กฐ๊ธ์ฉ ํํ์ด ๋ค๋ฅด์ง๋ง, ์ฌ๊ธฐ์ ์ค๋ช
ํ Graph Convolution
๋ค์ ๊ทธ๋ฆผ์ ๋ค์ํ ๋ฌธ์ ์ํฉ์์ GNN์ด ํ์ฉ๋๋ ๊ตฌ์กฐ๋ฅผ ๋ณด์ฌ์ค๋ค. ๊ทธ๋ํ ํ์ต์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ ์ ์ธํ๋ฉด, ๊ธฐ์กด์ ์ปดํจํฐ๋น์ , ์์ฐ์ด์ฒ๋ฆฌ ๋ถ์ผ์์ ํ์ฉ๋๋ ๋ชจ๋ธ ๊ตฌ์กฐ์ ํฌ๊ฒ ๋ค๋ฅด์ง ์๋ค.
- ์ผ์ชฝ ์์ ๊ทธ๋ฆผ์ ์๋ฅผ ๋ค๋ฉด, ๊ทธ๋ํ ์ ๋ณด๋ฅผ ์ ๋ ฅ๋ฐ์ ๊ทธ๋ํ์ ๋ ธ๋ ์ ๋ณด ๋๋ ๋ ธ๋ ๋ผ๋ฒจ์ ํ์ตํ๋ Node Classification ์ํฉ์ ์ ํฉํด๋ณด์ธ๋ค.
- ์ค๋ฅธ์ชฝ ์์ ๊ทธ๋ฆผ์ ๊ทธ๋ํ ์ ๋ณด๋ฅผ ์
๋ ฅ๋ฐ์, Encoder๋ก ๊ทธ๋ํ ํน์ฑ์ ํ์ตํ์ฌ ์๋๋ฒกํฐ(Latent Representation)
$z$ ๋ฅผ ์์ฑํ๊ณ , Decoder๋ก ์ํ ๊ทธ๋ํ๋ฅผ ์ฌํํ๋ ๋ฐฉ๋ฒ์ ํ์ตํ๋ Graph AutoEncoder (GAE)์ ์ ํ์ ์ธ ๋ชจ์ต์ ๋ณด์ฌ์ค๋ค. - ์ผ์ชฝ ์๋ ๊ทธ๋ฆผ์ ๊ทธ๋ํ๋ฅผ ์ ๋ ฅ๋ฐ์, Graph level representation์ ์ป๊ณ , ์ด๋ฅผ MLP์ ๋ฃ์ด ๊ทธ๋ํ ๋ ๋ฒจ ๋ถ๋ฅ๋ฌธ์ ๋ฅผ ํ๋ ์ํฉ์ ์ ์ ํ๋ค.
- ๋ง์ง๋ง์ผ๋ก ์ค๋ฅธ์ชฝ ์๋์ ๊ทธ๋ฆผ์ ์กฐ๊ธ ํน์ดํ๋ฐ, Spatio-Temporal GNN์ด๋ผ ๋ถ๋ฆฐ๋ค. ์ด๋ ๊ทธ๋ํ์ ๊ณต๊ฐ์ ๋ณด์ ์๊ฐ์ ๋ณด๋ฅผ ๋์์ ํ์ตํ๋ ๊ตฌ์กฐ๋ผ๊ณ ์๋ ค์ ธ ์๋๋ฐ, ๋ ผ๋ฌธ์ผ๋ก ์ฝ์ด๋ณด์์ ๋ฟ ์ค์ ์ฝ๋๋ก ์ฐ๊ตฌ์์ ํ์ฉํ ์ ์ ์๋ค. ์๋ง๋ Temporal GNN์ ๊ณต๋ถํ๊ฒ ๋๋ฉด, ๋ ๊น๊ฒ ์ดํดํ ์ ์์ ๊ฒ ๊ฐ๋ค.
์ด์ GNN์ ๋ํด ์์์ผ๋, ์ด๋ฅผ ๊ณ์ฐ๋ฌผ๋ฆฌํ ๋ถ์ผ์ ๊ณ ์ฒด๊ฒฐ์ ์ ๋ํ์ฌ ์ ์ฉํ Crystal Graph Convolution Neural Network (CGCNN)์ ๋ํด ์์๋ณด์. GNN์ ๊ณต๋ถํ๊ณ CGCNN์ ๋ณด๋ฉด, ์ฌ์ค ์์ฃผ ํน๋ณํ ์ ์ ๋ณ๋ก ์๋ค.
๋ค์ ๊ทธ๋ฆผ์ (a)๋ NaCl ์ด์จ๊ฒฐ์ ์ฒ๋ผ ๋ณด์ด๋ ๊ท์น์ ์ธ ๊ฒฐ์ ๊ตฌ์กฐ๊ฐ ์์๋ฅผ ๋ํ๋ด๋ ๋ ธ๋์ ์์๊ฐ ๊ฒฐํฉ์ ๋ํ๋ด๋ ์ฃ์ง๋ก ๋ณํ๋์ด ๊ทธ๋ํ ๊ตฌ์กฐ๋ก ๋ณํ๋๋ ๋์์ ๋ณด์ฌ์ค๋ค. ๋ฌผ๋ก , ๋ณํ๊ณผ์ ์ด ์์ฃผ ๋จ์ํ์ง๋ ์๊ณ , ์ค์ ๋ก๋ ์กฐ๊ธ ๊ท์ฐฎ์ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ด ๋ค์ด๊ฐ๋ค. ์๋ฅผ ๋ค์ด, ์์๋ ์์๋ฒํธ์ ๋ฐ๋ผ ์ด๊ธฐ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ฅผ ์ด๋ป๊ฒ ์ฒ๋ฆฌํด์ผ ํ ์ง์ ๋ํ ์ ๋ณด๊ฐ ํ์ํ๊ณ , ์์๊ฐ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ ๋ค, ์ด๋ฅผ ์ค๋ฆ์ฐจ์์ผ๋ก ์ ๋ ฌํ๊ณ , Gaussian Expansion์ด๋ผ๋ ๋ณํ์ ํตํด Edge Attributes๋ก ๋ฐ๊ฟ์ฃผ์ด์ผ ํ๋ค.
๊ทธ๋ฌ๋ ์ด๋ฌํ ์ ์ฒ๋ฆฌ๋ ๊ณ ์ฒด๋ฌผ๋ฆฌํ ๋๋ฉ์ธ ์ง์์ ๊ฐ๊ณ ์๋ค๋ฉด ๋๊ตฌ๋ ์ด๋ ต์ง ์๊ฒ ํ ์ ์๋ค. ์ค์ํ ๊ฒ์ ์ด์ ๋ถํฐ ๋ฌผ์ง์ ํน์ฑ์ ๋ํ ์ฐ๊ตฌ๋ฅผ, ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฌธ์ ๋ก ๋ฐ๊ฟ ์ ๊ทผํ ์ ์๋ค๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆผ (b)๋ ๊ทธ๋ํ ๊ตฌ์กฐ๋ก ๋ณํ๋ Crystal Graph๊ฐ GNN์ ์ ๋ ฅ๋๋ ๋์์ ๋ณด์ฌ์ค๋ค.
์ค๋ฅธ์ชฝ์ ์์๋ค์, CGCNN ๋ ผ๋ฌธ์์ ํํํ๋ ๋ชจ๋ธ์ ์์ฉ์ ๋ํ๋ธ ์์์ด๋ค.
์๋ฅผ ๋ค๋ฉด, ์ค๋ฅธ์ชฝ ์์ ์ฒซ๋ฒ์งธ ์์์ ์ค์ฌ๋
ธ๋
์๋ง ๋ฐ์ดํฐ๋ง์ด๋ ๋ถ์ผ์์ GNN์ ๋ฐฐ์ด ํ์์ด๋ผ๋ฉด, ์ด ๋ชจ๋ธ์ด GNN์ ๋จ์ํ ์์ฉ์ฒ๋ผ ๋๊ปด์ง์ง๋ ๋ชจ๋ฅด๊ฒ ๋ค. ํ์ง๋ง, ์ ์๋ ํด๋น ๋ ผ๋ฌธ์์ ๊ธฐ์กด์ Graph Convolution์ ์์ ํ์ฌ ๊ฒฐ์ ๊ตฌ์กฐ ๋๋ฉ์ธ์ ์ ํฉํ ์ฑ๋ฅ์ ์ด๋์ด๋ด๋ ์กฐ๊ธ ํน์ํ Convolution ์์์ ์ ์ํ์๋ค.
์์์ ๋ณด๋ฉด, $z_{(i, j)}_k^t๊ฐ ์๋ก ๋ค๋ฅธ ๋ ์ข ๋ฅ์ Parameterized ์ ํ๋ณํ์ ํต๊ณผํ๊ณ , ์๋ก ๋ค๋ฅธ ๋ ์ข ๋ฅ์ ๋น์ ํ ํจ์์ ์์ฉ์ ๋ฐ์ ์ฒ๋ฆฌ๋์ด (CGCNN ์ฝ๋์ ์ํ๋ฉด, ๊ฐ๊ฐ Sigmoid ํจ์์ Softplus ํจ์), Concatenation์ผ๋ก ํ๋์ ๋ฒกํฐ๋ก ํฉ์ณ์ง๋ค๋ ๊ฒ์ ์ ์ ์๋ค.
์ด ๋ ผ๋ฌธ์ ์ฒ์ ๋ณด์์ ๋๋ ์ด ์์์ ์๋ฏธ๋ฅผ ๋ณ๋ก ๊น๊ฒ ์๊ฐํ์ง ์๊ณ , ๊ทธ๋ฅ ์ ์๊ฐ ์ฌ๋ฌ๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์คํํด๋ณด๋ค๊ฐ ๊ด์ฐฎ์ ๊ตฌ์กฐ๋ฅผ ์ฐพ๊ณ ์์ํํ ๊ฒ์ด๊ตฌ๋, ์ ๋๋ก ์ดํดํ์๋๋ฐ, ์ง๋๊ต์๋์ ๋ง์์ ๋ฐ๋ฅด๋ฉด ๊ทธ๋ ์ง ์์ ๊ฒ ๊ฐ์๋ค.
์ง๋๊ต์๋์ ๋ง์์ผ๋ก๋, ๋ฒกํฐ
๋ค์ ๊ทธ๋ฆผ์ CGCNN์ ๋ํ์ฌ Materials Project์์ 47000๊ฐ์ ํ๋ก๋ธ์ค์นด์ดํธ ๋ฐ์ดํฐ์ ์ ํ์ตํ์ฌ ์ป์ด์ง ๋ฌผ์ฑ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
๊ทธ๋ฆผ (a)๋ ๊ฐ ๊ฒฐ์ ๊ตฌ์กฐ๊ฐ Unitcell ์์์ ๊ฐ๊ณ ์๋ ๊ตฌ์ฑ์์์ ๋ถํฌ๋ฅผ ๋ณด์ฌ์ค๋ค. Perovskite๋
๊ทธ๋ฆผ (b)๋ ํ์ต์ ์ฌ์ฉ๋ ๊ฒฐ์ ๊ตฌ์กฐ์ ์์ ๋ฐ๋ผ ๋ฌผ์ฑ์์ธก์ ์ค์ฐจ(MAE)๊ฐ ๊ฐ์ํ๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ์ด๊ฒ์ ๋ฅ๋ฌ๋์ ๊ณต๋ถํ ์ฌ๋ ์ ์ฅ์์๋ ์์ฐ์ค๋ฌ์ด ๊ฒฐ๊ณผ์ด๋ฏ๋ก ๋ฐ๋ก ์ค๋ช ์ด ํ์์์ ๊ฒ ๊ฐ๋ค.
๊ทธ๋ฆผ (c)๋ ๋ชจ๋ธ์ด ์์ธกํ๋ ์๋์ง์ DFT ๊ณ์ฐ์ ์ํด ์ป์ด์ง ์๋์ง๊ฐ, ๋๋ฑํ ์์ค์์ ์ ํ๊ด๊ณ๋ก ์ ์ผ์นํ๊ณ ์์์ ๋ณด์ฌ์ค๋ค. ์ฆ, CGCNN์ DFT์ ์ ์ฌํ ์์ค์ ์ ํ๋ ๋ฐ ๊ทธ๋ณด๋ค ํจ์ฌ ๋น ๋ฅธ Inference ๋ฅ๋ ฅ์ ๊ฐ๊ณ ์๋ค.
๊ทธ๋ฆผ (d)๋ CGCNN์ ๋ฌผ์ฑ์์ธก(Regression)์ด ์๋๋ผ, Metal/Semiconductor์ ์ด์ง๋ถ๋ฅ(Classification)ํ๋ ๋ฌธ์ ์ ์ ์ฉํ์ ๋ ๋ถ๋ฅ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค. ๋ฌผ๋ฆฌํํ ๋ถ์ผ์์๋ ๋ฌผ์ฑ์์ธก์ ๋นํ๋ฉด, ๋ฌผ์ง์ ๋ถ๋ฅ๋ ์๋์ ์ผ๋ก ์ฌ์ด ํธ์ ์ํ๊ธฐ ๋๋ฌธ์ ๋น์ฐํ ์ค์ํ ๊ฒฐ๊ณผ๊ฐ ๋์๋ค.
์ค๋ฅธ์ชฝ์ Table 1์ 7๊ฐ์ง ์ฃผ์ํ ๋ฌผ์ฑ์์ธก์ ๋ํด ๋ชจ๋ธํ์ต์ ์ฌ์ฉ๋ ํ๋ จ ๋ฐ์ดํฐ์ ์, ๋ฌผ์ฑ์ ๋จ์, ํ์ต๋ ๋ชจ๋ธ์ ์ค์ฐจ์ DFT ์ค์ฐจ์ ๋น๊ต๋ฅผ ๋ณด์ฌ์ค๋ค. ์๊ฐ๋ณด๋ค ์ ์ ์์ ๋ฐ์ดํฐ(MNIST ์์ ๋ฐ์ดํฐ๋ณด๋ค ์ ์ ์)๋ก DFT ์์ค์ ์ค์ฐจ๋ฅผ ๊ฐ๋ ๋ชจ๋ธ ํ์ต์ด ์ด๋ฃจ์ด์ง ์ ์๋ค๋ ์ ์ด ํฅ๋ฏธ๋กญ๋ค.
CGCNN ๋ ผ๋ฌธ์ ์ฝ๊ณ ๋์ ์ด๊ฒ ์ ๋ง ๊ฐ๋ฅํ์ง ๊ถ๊ธํด์, ์ฝ๋ ๋ฆฌ๋ทฐ ์ดํ ํ๊ฐ์ง ๋ฌผ์ฑ์ ๋ํ์ฌ CGCNN ์ฐ๊ตฌ๋ฅผ ์ฌํํด๋ณด๊ธฐ๋ก ํ์๋ค. ๋ด๊ฐ ์ ํํ๋ ๋ฌผ์ฑ์ 'Energy per Atom'์ด์๊ณ , ์ด๋ Materials Project ๊ณ์ฐ๊ณผํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ฝ๊ฐ์ Python API๋ฅผ ๋ค๋ฃฐ ์ค ์๋ฉด ๋๊ตฌ๋ ์ฌ์ฉํ ์ ์๋ค.
๊ฒฐ์ ๊ตฌ์กฐ ๋ฐ์ดํฐ๋ฅผ Python์ผ๋ก ๋ค๋ฃฐ ๊ฒฝ์ฐ, **PyMatgen (Python Materials Genomics)**๋ฅผ ํ์ฉํ๋ฉด ๋งค์ฐ ํธ๋ฆฌํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ Pymatgen์ ์ด์ฉํ์ฌ, ํน์ ํ CIF(Crystallographic Information File) ID๋ฅผ ๊ฐ๋ ๋ฌผ์ง์ ๊ตฌ์กฐ์ ๋ณด๋ฅผ ๊ฐ์ ธ์จ ๊ฒ์ด๋ค. Pymatgen Structure ๊ฐ์ฒด๋ Primitive space์์ Unitcell์ ๊ตฌ์ฑํ๋ Lattice Parameter, ๊ฒฐ์ ์ ๊ตฌ์ฑํ๋ ์์ ์ข ๋ฅ, ๊ทธ๋ฆฌ๊ณ Cartesian ๋๋ Fractional Coordinates ๊ธฐ์ค์ ์์์ขํ๋ฅผ ์ ๋ ฅ๋ฐ์ ์ ์๋๋ค.
๋ํ, Structure ๊ฐ์ฒด๋ ๋ค์ํ ๋ฉ์๋๋ฅผ ์ ๊ณตํ๋๋ฐ, ์ด๊ฒ์ ์ด์ฉํ๋ฉด ์ ์ฒ๋ฆฌ๋ฅผ ์ข ๋ ์ฝ๊ฒ ํ ์ ์๋ค. ์ค์ ๋ก CGCNN ์ ์๋ ์ ์ฒ๋ฆฌ ๊ณผ์ ์์ Pymatgen์ ์ ๊ทน์ ์ผ๋ก ํ์ฉํ์ฌ Crystal Graph์ ๋ ธ๋์ ์ฃ์ง ์ ๋ณด๋ฅผ ์ ์ฒ๋ฆฌํ์๋ค.
๋ค์ ๊ทธ๋ฆผ์ CGCNN์ ํ์ต๊ณผ์ ์ ์บก์ฒํ ๊ฒ์ด๋ค. Target Property๋ Energy per Atom์ด๊ณ , ์ด 40 Epochs๋ก ํ์ตํ์๋ค. ๋ํ, Original CGCNN์ Torch๋ง์ผ๋ก ์์ฑ๋์์ผ๋ฉฐ, ์์ฆ GNN ์ฐ๊ตฌ์ ์์ฃผ ์ฌ์ฉ๋๋ PyG๋ dgl์ ์ ํ ์ฌ์ฉ๋์ง ์์๋ค. ์ฆ, Torch ๋ ๋ฒจ์์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, Graph Batch๋ฅผ ์ํ Collate Function, Custom Layer ๋ฑ์ ๋ชจ๋ ๊ตฌํํ์๊ธฐ ๋๋ฌธ์ ์ฝ๋๊ฐ ์๋นํ ๊ธธ๋ค. ์ฝ๋๊ฐ ๋ถํ์ํ ์ ๋๋ก ๊ธธ๊ณ , ๋จ์ ์ฝ๋๋ ์์ ๋กญ๊ฒ ๋ค๋ฃจ๊ธฐ ๋ถํธํด์, ๋ด ์ฐ๊ตฌ์์๋ ๊ฑฐ์ ๋์ผํ GNN์ PyG ํ์์ผ๋ก ๋ฆฌํฉํ ๋งํ์ฌ ์ฌ์ฉํ๊ณ ์๋ค.
๊ทธ๋ฆผ์ ๋ณด๋ฉด, ๊ฐ Epoch๋ง๋ค MAE ๊ฐ์ด ๋ณด์ด๊ณ ๊ทธ ๊ฐ์ ์ต์ข ์ ์ผ๋ก ์ฝ 0.1 ์์ค์์ ์ ์ ์๋ค. ์ด๋ CGCNN ๋ ผ๋ฌธ์ ์ฃผ์ฅ๊ณผ ์ผ์นํ๋ฏ๋ก ๋ถ๋ถ์ ์ธ ์ฌํ์ฑ์ ํ์ธํ ์ ์์๋ค.
์ค์ ๋ก CGCNN์ ์ฌ์ฉํ๋ฉด์ ๋ค์ ํน์ดํ๋ค๊ณ ์๊ฐํ๋ ์ ์, ํ์ต๊ณผ์ ์์ ์ต์ด์ 1 Epoch์ ๊ฑธ๋ฆฌ๋ ์๊ฐ์ด ๊ต์ฅํ ์ค๋ ๊ฑธ๋ ธ๋ค๋ ์ ์ด๋ค. ์๋ง ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํ๊ณ Batch ๋จ์๋ก ๋ฐ์์ค๋ ๊ณผ์ ์์ ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ๋ ๊ฒ ๊ฐ์๋ฐ, ๊ทธ ์ดํ์ Epoch ์์๋ ๊ทธ๋ ๊ฒ ์ค๋ ์๊ฐ์ด ๊ฑธ๋ฆฌ์ง ์์๋ค. PyG ๋ฒ์ ์ผ๋ก ์์ ๋ CGCNN์์๋ ๋งค Epoch๋ง๋ค ๊ฑฐ์ ์ผ์ ํ๋ฐ, ์ ์ด๋ฐ ํ์์ด ๋ฐ์ํ๋์ง๋ ์๋ฌธ์ด๋ค. ใ ใ
์ด๋ ๊ฒ ํด์ ์ง๊ธ๊น์ง ์์ง๋ฌผ๋ฆฌํ ๋ถ์ผ์์์ GNN ์์ฉ์ ๋ํ ๊ธฐ์ด์ ์ธ ๋ด์ฉ์ ์ดํด๋ณด์๋ค. ๊ทธ๋ผ ์ด ๋ถ์ผ๋ ์ด์ ์ฐ๊ตฌํ ์ฃผ์ ๊ฐ ์์๊น? ์ฌ์ค ๋ง์ด ๋จ์์๋ค. ๊ทธ ์ค ํ๊ฐ์ง๋ฅผ ์๊ฐํ๊ฒ ๋ค.
๋๋ถ๋ถ์ ๊ณ์ฐ๊ณผํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ณดํต ์ฐ์ฐ์ ์ต์ข ๊ฒฐ๊ณผ์ ๊ด์ฌ์ด ์๋ค. ์ฆ, DFT ๋ฑ์ ์๋ฎฌ๋ ์ด์ ๊ธฐ๋ฒ์ผ๋ก ๋ฌผ์ง์ ๊ณ์ฐํ๋ฉด ์ฌ๋ฌ๊ฐ์ง Optimization์ด ๊ฐํด์ง๊ณ , ๊ทธ ๊ณผ์ ์์ ๋ฌผ์ง์ ์ ์ ์์ ๋ ๊ตฌ์กฐ๋ก ๋ณํ๋๊ธฐ ์์ํ๋ค. ์๋ฎฌ๋ ์ด์ ์ด ๋๋๋ฉด, ์ต์ ํ๋ ๊ตฌ์กฐ์์ ๋ฌผ์ง์ Unitcell Lattice Parameter, ๊ฐ ์์์ Coordinates, Free Energy, Basis ๋ฑ์ด ์ป์ด์ง๋ค.
๋ฌผ๋ฆฌ์ ๊ด์ ์์, ์ด๋ค ๋ฌผ์ง์ด ์์ ์ (Stable), ๋๋ ์ค์์ ์ (Meta-stable)ํ๋ค๋ ํํ์ ์๋์ง๊ฐ ์์ ๋ ์ํ๋ผ๋ ๋ป์ด๊ธฐ ๋๋ฌธ์, Hamiltonian(์๋์ง) ํจ์์ ๊ด์ ์์ ๋ณด๋ฉด ๋ฌผ์ง์ ๊ตญ์์ ์ต์์ (local minimum)์ ํ ์ ์ ์๋ ๊ฒ๊ณผ ๊ฐ๋ค. ๋ฐ๋ผ์ ๊ทธ๋ฌํ ์ํ์ ๋ฌผ์ง์ local states์ ์๋ค๊ณ ํ๋ค.
๊ทธ๋ฌ๋ ๋ฌผ์ง์ ์ํธ์์ฉ์ Local states๋ง ์๋ ๊ฒ์ด ์๋๋ค. ์์ ๋ ์ํ๊ฐ ์๋ค๋ฉด, ๋ฐ๋๋ก ๋ถ์์ ํ๊ณ ์ด์ ์๋(Thermal Fluctuation)์ด ์๋ ๋นํํ์ํ๊ฐ ์์ผ๋ฉฐ, ๋ฌผ๋ฆฌํ์๋ค์ ์ด๋ฐ ์ํ์ ๋ํด์๋ ๋ฌผ์ฑ์์ธก์ ํ๊ณ ์ถ์ดํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ ๋ด๊ฐ ์์ ์ ์ธ๋ฏธ๋์์ ๋ฐํํ๋ ์๋ฃ์ ์ผ๋ถ์ด๋ค.
๊ทธ๋ฆผ์ ์ผ์ชฝ์ ๋ณด๋ฉด, ์ง์์ ์ฐํ๊ฒ ๋ฐฐ์ด๋ ์ ์๊ตฌ์กฐ๊ฐ ๋ณด์ธ๋ค. ์ด๋ ๊ฒ ๊ท์น์ ์ธ ๊ตฌ์กฐ๋ ๋ณดํต ์๋์ง ๊ด์ ์์๋ ์์ ์ ์ธ ํํ์ํ๊ฐ ๋๋ค. ์ ๊ทธ๋ฆผ์ ์ค๋ฅธ์ชฝ์ ๋ณด๋ฉด, ์ฌ๋ฌ ์ ์๋ค์ด ๋ถ๊ท์นํ๊ฒ ํฉ์ด์ ธ ์๊ณ , ์ ์๊ฐ์ ๊ฒฐํฉ๋ ๋์ด์ ธ ์๋ ๊ฒ์ ์ ์ ์๋ค. ์ด๋ฐ ์ํ๋ฅผ ๋นํํ์ํ๋ผ๊ณ ํ๋ค.
์ด๋ฌํ ๋นํํ์ํ์์์ ๋ฌผ์ฑ์์ธก์ ์ฌ์ค ํํ์ํ์์์ ์์ธก๊ณผ ํฌ๊ฒ ๋ค๋ฅผ ๊ฒ ๊ฐ์ง ์๋ค. ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ฌ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จ์ํค๋ฉด ๋ ์๋๊น?
์ฌ์ค ๋ฐ์ดํฐ๋ง ์ถฉ๋ถํ ์๋ค๋ฉด ๊ทธ๊ฒ ๊ฐ๋ฅํ ๊ฒ ๊ฐ๋ค. ๋ฌธ์ ๋ ๋๋ถ๋ถ์ ๊ณ์ฐ๊ณผํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์๋ ํํ์ํ์ ๋ํ ์๋ฃ๋ง์ด ์์ผ๋ฏ๋ก ๋นํํ์ํ์ ๋ํ ๋ฌผ์ฑ์์ธก์ ํ์ต์ํค๊ณ ์ถ์ด๋ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ ๊ฒ์ด๋ค.
๊ทธ๋์ ์์ฆ ์ด์ชฝ ๋ถ์ผ์์ ๋ฐํ๋๋ ์ฐ๊ตฌ๋ ๋๋ถ๋ถ, ์ฐ๊ตฌ์๋ค์ด ๊ด์ฌ์์ดํ๋ ํน์ ๋ฌผ์ง์ ํ์ ํ์ฌ DFT ์๋ฎฌ๋ ์ด์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ณ , ๊ทธ ๋ฐ์ดํฐ์ ๋ํ ๋ถ์์ด๋ ํ์ต์ ํตํด ์ ์๋ฏธํ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๋ฐฉ์์ด ๋ง์ ๊ฒ ๊ฐ๋ค.
์ด์ ๊ด๋ จํ์ฌ ๋ ํ๋์ ์ฌ๋ฏธ์๋ ์ฐ๊ตฌ๋ฅผ ์๊ฐํ๋ค.
CGCNN ์ ์๋ Unsupervised Graph Neural Network๋ฅผ ์ด์ฉํ์ฌ, Graph Sequence ํํ์ ๋ฐ์ดํฐ์ ๋ํด Sequence์ ์ธ ์ฑ์ง์ ์์ธกํ๋ ์ฐ๊ตฌ๋ฅผ ๋ฐํํ ์ ์ด ์๋ค.
๊ฐ๋จํ ํด๋น ๋ ผ๋ฌธ์ ์์ฝํ์๋ฉด, DFT๋ฅผ ์ด์ฉํ์ฌ Ab-initio Molecular Dynamics ์๋ฎฌ๋ ์ด์ ์ ํ์๊ณ , ๊ทธ ๊ฒฐ๊ณผ ์ป์ด์ง ์ฌ๋ฌ ์ ์๋ค์ ์ด์ ์๋์ ์๊ฐ์ ๋ณํ๋ฅผ ์ผ์ข ์ Graph sequence ๋ฐ์ดํฐ๋ก ์ ์ฒ๋ฆฌํ์ฌ, ๋ชจ๋ธํ์ต์์ผฐ๋ค๋ ๊ฒ ๊ฐ๋ค.
ํน์ดํ๊ฒ๋ ๋ค๋ฆ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด, ๋ชจ๋ธ์์ Feature Extraction์ ์ํ ์ ๊ฒฝ๋ง์ผ๋ก 2๋์ shared weight๋ฅผ ๊ฐ๋ GCN์ด ์ฌ์ฉ๋์์ผ๋ฉฐ, ๋ GCN์ ๊ฒฐ๊ณผ๋ก ์์ฑ๋๋ ๋ฒกํฐ๋ฅผ ํฉ์ณ VAMP loss๋ผ๋ ์์คํจ์๋ฅผ ์ ์ํ๊ณ , ํด๋น ์์คํจ์์ ๋ํ ์ต์ ํ ๊ณผ์ ์ ์ํํ์ฌ, MD simulation ์์์ Markov Process ํจํด์ ๋ฐ๊ฒฌํ์๋ค๊ณ ํ๋ค.
์ฆ, ์ ์๋ 4์ข ๋ฅ์ Markov state๊ฐ ์์์ ๋ฐํ๋ด์๊ณ , 4๊ฐ์ state๋ค ์ฌ์ด์ ์ ์ดํ๋ฅ (Transition Probability)๊น์ง ๋ฐํ๋ด์ด, ํน์ ํ ๋ฌผ์ง์ MD Simulation์ ๋ํ ์ ์๋ฏธํ ์ฑ๊ณผ๋ฅผ ๋ด์๋ค.
๊ฐ์ธ์ ์ผ๋ก ์๋นํ ๋ ์ฐฝ์ ์ธ ์ฐ๊ตฌ๋ผ๊ณ ์๊ฐํ๋ค. ์๋ํ๋ฉด ์ผ๋ฐ์ ์ผ๋ก MD Simulation์์ ๊ทธ ์ ๋์ ์ ์๋ฏธํ ๊ด์ธก ๊ฒฐ๊ณผ๋ฅผ ์ป์ด๋ด๋ ค๋ฉด ์๋นํ ์ค๋ ์๊ฐ ๊ณ์ฐ์ ํด์ผ ํ๋๋ฐ, ์ ์๋ ๋ ผ๋ฌธ์์ ์์ฒ๊ฐ ์ ๋์ MD trajectory๋ก ํด๋น ๊ฒฐ๊ณผ๋ฅผ ์ป์ด๋ด์๊ธฐ ๋๋ฌธ์ด๋ค! (๋๋ ์ด๋ฐ ์ฐ๊ตฌ ํด๋ดค์ผ๋ฉด.. )
์ด๋ ๊ฒ ํด์ Graph Neural Network ๋ฐ ๊ณ์ฐ๋ฌผ๋ฆฌํ์ ๊ดํ ๊ธ์ ๋๋ง์น๊ฒ ๋์๋ค. ๋ด ๋ธ๋ก๊ทธ์์ ์ด ๊ธ์ด ํญ์ ๊ฒ์์ ์์๊ถ์ ์์๊ธฐ ๋๋ฌธ์, ์ ๋๋ก ๋ง๋ฌด๋ฆฌ์ง์ง ๋ชปํ ๊ธ์ ๋ค์ ํ๋ฒ ์ ๋ฆฌํด์ผ๊ฒ ๋ค๊ณ ๋ง์๋จน๊ณ ์์๋ค. ํ์ง๋ง ๊ทธ ๋์ ์์ฒญ๋๊ฒ ๋ฐ๋น ์ ๋์ ํ ๊ทธ๋ด ํ์ด ์์๊ณ , ์ด์ ์์ผ ๊ธ์ ๋ง๋ฌด๋ฆฌ์ง๊ฒ ๋์๋ค.
GNN์ด๋ DFT๋ ๋ชจ๋ ๋๋จํ ๋ฐฉ๋ํ๊ณ ์ด๋ ต๋ค. ๊ทธ๋ฌ๋ ์ ๋๋ก ์ตํ๋๋ฉด ์์ฉ๊ฐ๋ฅ์ฑ๋ ๋ง์ ๋ถ์ผ์ด๋ค. ๋๋ 2๊ฐ์ง ๋ชจ๋ ๋ชปํ๋ ๋ฐ๋ณด ๋ํ์์์ด์ง๋ง, ๊ทธ ๋์ ๊ณต๋ถํ๋ ๋ด์ฉ์ ์ ๋ฆฌ๋ฅผ ์ํด ์ด ๊ธ์ ์ฐ๊ฒ ๋์๋ค. ์๋ชป๋ ๋ด์ฉ์ ๋ํ ์ง์ ์ด๋ ์ง๋ฌธ์ ์ธ์ ๋ ํ์ํ๋ค. ใ ใ
- https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.120.145301 : CGCNN
- https://github.com/txie-93/cgcnn : CGCNN Repository
- https://ieeexplore.ieee.org/document/4700287 : 2009, GNN
- https://arxiv.org/abs/1609.02907 : GCN
- https://www.nature.com/articles/s41467-019-10663-6 : GDN
- https://arxiv.org/abs/1710.10903 : GAT
- https://en.wikipedia.org/wiki/Density_functional_theory : DFT
- https://dcollection.kangwon.ac.kr/srch/srchDetail/000000032796
- https://iopscience.iop.org/article/10.1088/2515-7639/ab084b : from DFT to machine learning