2026.04.25 (토)

  • 맑음동두천 19.6℃
  • 맑음강릉 24.1℃
  • 맑음서울 20.6℃
  • 맑음대전 21.3℃
  • 맑음대구 23.5℃
  • 맑음울산 17.7℃
  • 맑음광주 22.2℃
  • 맑음부산 16.4℃
  • 맑음고창 16.9℃
  • 맑음제주 18.7℃
  • 맑음강화 14.6℃
  • 맑음보은 21.7℃
  • 맑음금산 22.7℃
  • 맑음강진군 17.3℃
  • 맑음경주시 19.5℃
  • 맑음거제 16.4℃
기상청 제공

삼성전자, 세계 20여 개 R&D센터서 '갤럭시 AI' 언어 모델 고도화

[KJtimes=김봄내 기자삼성전자가 언어 장벽 없이 자유로운 소통이 가능하도록 돕는 갤럭시 AI’의 언어 모델 개발 과정을 공개했다 

 

삼성전자는 언어를 넘어 문화를 이해하고 지식을 갖춘 고도화된 갤럭시 AI를 위해 전 세계 총 20여 개의 R&D센터에서 언어 모델 연구·개발에 매진하고 있다.

 

갤럭시 AI의 온디바이스 실시간 통·번역 기능은 현재 16개 언어를 지원 중이다. 삼성전자는 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어의 4개 언어를 더 추가해 총 20개 언어를 지원할 계획이다.

 

삼성전자의 갤럭시 AI 언어 모델은 언어의 특성과 문법에 대한 정량 평가 문화에 대한 지식과 이해를 검증하는 정성 평가 등을 거쳐 공개된다.

 

아랍어는 20여 개국 4억 명 이상이 사용하는 세계에서 6번째로 많이 사용되는 언어다. 아랍어를 통·번역에 활용하기 위해서는 현대 표준 아랍어인 풋스하(Fusha)’와 일상생활에서 사용하는 방언인 암미야(Ammiyya)’를 모두 학습해야 한다. 특히 아랍어 방언은 총 30여 종에 달한다.

 

삼성리서치 요르단 연구소(SRJO)는 아랍어 방언을 이해하면서, 답변은 표준 아랍어로 할 수 있는 언어 모델을 개발했다. 이를 위해 각기 다른 방언의 음성 녹음 데이터를 수집하고, 이를 직접 텍스트로 변환하는 과정을 거쳤다.

 

데이터베이스 구축을 맡은 요르단 연구소의 아야 하산(Ayah Hasan)여러 방언의 미묘한 차이와 변형을 정확히 이해할 수 있는 원어민들로 갤럭시 AI 팀을 구성하고, 음성 데이터를 일일이 글과 문장으로 바꾸는 수작업을 진행했다고 설명했다.

 

삼성전자는 아랍어의 복잡성에 대한 깊은 이해와 신중한 데이터 선별을 진행하고, 고급 모델링 기술을 적용해 아랍어를 갤럭시 AI에 추가할 수 있었다.

 

베트남어는 전 세계 약 1억 명이 사용하는 언어로 중국어, 태국어 등 인근 지역 언어와 비슷한 성조 체계를 지니고 있다. 특히 베트남어는 여섯 가지의 성조를 가진다. 예를 들어 베트남어 단어 (Ma)’는 성조에 따라 엄마(Má), 무덤(Mả), 귀신(Ma) 등 전혀 다른 의미를 지녔다.

 

삼성리서치 베트남 연구소(SRV)는 성조의 미세한 차이를 인식할 수 있도록, 음성 데이터를 매우 정교하게 다듬고 정제하는 과정을 거쳤다. 무엇보다 성조를 정확히 구분해 내기 위해 한 단어를 0.02초 전후의 짧은 프레임으로 잘라내고 이를 데이터베이스화했다.

 

중남미 22개국의 공식 언어는 스페인어다. 하지만 같은 스페인어라도 동일한 대상을 지칭하는 단어는 국가와 지역에 따라 천차만별이다.

 

예를 들어 멕시코에서는 수영장을 알베르카(alberca)’라고 한다. 하지만 아르헨티나, 파라과이, 우루과이에서는 필레타(pileta)’라고 부른다. 콜롬비아, 볼리비아, 베네수엘라에서는 피시나(piscina)’라고 표현한다.

 

중남미 지역의 언어 모델 개발을 담당한 삼성리서치 브라질 연구소(SRBR)는 갤럭시 AI가 중남미 국가의 스페인어 차이를 이해할 수 있도록, 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

 

28000만 명, 인구 4위의 인도네시아는 28000만 인구가 인도네시아어를 사용하고 있다. 인도네시아어는 관사, 복수형, 동사의 시제 변화가 없어서 상대적으로 배우기 쉬운 언어로 평가받는다. 하지만 반대로 문장의 맥락을 충분히 파악하지 못하면 내용을 이해할 수 없어 통·번역이 쉬지 않은 언어이다.

 

이러한 언어적 특성을 반영해 삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 인공신경망번역(Neural Machine Translation, NMT)’ 방식을 적용했다. 단어가 아닌 문장 단위로 언어를 학습시켜, 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.




배너

글로벌 공정시장

더보기
[회장님은 법원에③] 조세포탈 혐의에 휘말린 오너들, 위협받는 그룹의 미래
[KJtimes=김은경 기자] 기업의 평판은 하루아침에 만들어지지 않지만, 오너 한 사람의 일탈로 무너지는 데는 그리 오래 걸리지 않는다. 조세 포탈 혐의로 재판정에 섰던 오너들 가운데 상당수는 사건이 잊히길 기다리듯 조용히 모습을 감춘다. 그러나 이들의 법적 분쟁은 아직도 기업 경영의 깊은 곳에서 흔들림을 만들고 있으며, 공적 책임 대신 관대한 판결이 이어지는 동안 '오너리스크'는 더욱 구조화되고 있다. <kjtimes>는 최근까지 공개된 판결과 마지막 보도를 기준으로, 그 이후 별다른 진척 없이 방치된 오너들의 법적 문제를 검토하며, 이로 인해 기업이 어떤 리스크를 안게 되었는지 짚어본다. ◆"무죄 판결 이후 이어진 침묵"구본상 LIG그룹 회장 구본상 회장은 경영권 승계 과정에서 세금 신고가 부정확했다는 혐의로 재판에 넘겨졌지만, 법원은 1심에서 무죄를 선고했다. 당시 재판부는 "조세 채무가 성립한다고 보기 어렵다"고 판단했다. 이에 대해 일각에서는 "구본상 회장의 경우처럼 '경영권 승계' 과정에서 수백억~수천억대 세금이 걸린 거래를 할 때, 실질 가격 평가와 세금 부과를 어떻게 엄격히 할 것인가, 단지 서류가 아니라 실질을 기준에 두는 공정

코로나 라이프

더보기

현장+

더보기

탄소중립리포트

더보기
"난방 때문에 태양광 전기 버려진다"…LNG 열병합발전의 '불편한 진실'
[KJtimes=견재수 기자] 재생에너지 비중이 확대되는 에너지 전환 국면에서, 그간 고효율 설비로 평가받던 LNG 열병합발전이 오히려 태양광과 풍력의 계통 수용성을 저해하는 ‘경직성 자원’으로 작용하고 있다는 분석이 제기됐다. 사단법인 기후솔루션은 16일 이슈브리프 「재생에너지 확대를 가로막는 LNG 열병합발전」을 통해, LNG 열병합발전의 운영 구조가 재생에너지 출력제어를 심화시키는 주요 원인이라고 지적했다. 보고서는 재생에너지 시대의 발전 설비 기준이 과거의 ‘효율성’에서 ‘유연성’으로 이동해야 함을 강조하며, 전력 계통 운영의 근본적인 체질 개선을 촉구했다. ◆ 재생에너지 밀어내는 '열제약 발전'...계통 경직성 심화 보고서에 따르면 LNG 열병합발전은 열 수요가 발생하면 전력 수요와 관계없이 전기와 열을 동시에 생산해야 하는 구조적 한계를 지닌다. 특히 전력 수요는 낮고 태양광 발전량은 많은 봄·가을철 낮 시간대에, 열 공급 유지를 위해 가동되는 가스발전(열제약 발전)이 재생에너지가 들어갈 자리를 선점하고 있다는 지적이다. 기후솔루션은 실제 계통 운영 사례를 통해 이러한 충돌을 증명했다. 2025년 3월 9일 오후 1시 기준, 육지 재생에너지 출력제

증권가 풍향계

더보기