from scratch 논쟁 정리 보고서 (초보자용)이 문서는 최근 제기된 **"Solar Open 모델이 정말 from scratch로 학습되었는가?"**라는 논쟁을 초보자도 이해할 수 있도록 양쪽 입장을 정리하고, 마지막에 누구의 주장이 더 합리적인지를 평가한다.
👉 중요한 점:
코드(설계)는 오픈소스를 써도 상관없고, 가중치를 가져왔는지가 핵심 기준이다.
| 용어 | 의미 | from scratch인가? |
|---|---|---|
| Fine-tuning | 기존 모델에 살짝 추가 학습 | ❌ |
| Continued pretraining | 기존 모델을 더 오래 학습 | ❌ |
| Partial reuse | 일부 가중치만 재사용 | ❌ |
| From scratch | 가중치 0부터 전체 학습 | ✅ |
Solar Open 모델은 다음과 같은 큰 구조 변경을 포함한다:
Hybrid MoE (깊이 의존 구조)
RoPE 전략 변경
Normalization 구조 변경
👉 결론적으로:
"이 정도로 구조를 바꿨다면 기존 모델을 재활용했을 가능성은 낮다"
“아키텍처를 바꿨다고 해서 기존 가중치를 안 썼다고 증명되지는 않는다.”
👉 이론적으로는 가능하다는 주장
증거 부족
Tokenizer 정보 부재
코드 계보(lineage)
| 항목 | 입장 A (from scratch) | 입장 B (의심) |
|---|---|---|
| 아키텍처 변경 | 매우 큼 | 변경만으로는 불충분 |
| 기존 weight 호환성 | 거의 없음 | 부분 재사용 가능성 존재 |
| 실무 합리성 | 재사용이 오히려 비효율 | 이론적으로 가능 |
| 증거 제시 | 설계 근거 중심 | 로그·증명 요구 |
입장 A가 훨씬 더 현실적
제안된 partial reuse 시나리오는
👉 실무 관점에서는 from scratch 쪽이 자연스러움
그러나 입장 B의 지적도 형식적으로는 정당
로그·문서가 없으면
기술적으로 보면 Solar Open이 from scratch로 학습되었을 가능성이 매우 높다.
다만, 외부에서 100% 확신하려면 더 많은 증거(학습 로그 등)가 필요하다.
즉,
설계 변경만 놓고 보면 from scratch가 맞고, 증명 자료만 놓고 보면 논쟁의 여지는 남아 있다.
(참고) 이 보고서는 ChatGPT 를 통해 생성한 문서로 기술 비전문가도 이해할 수 있도록 의도적으로 수학·코드·논문 수준의 설명을 생략했습니다.
(참고2) 업스테이지에서 어제 급하게 라이선스 업데이트를 했다는데, 라이선스 누락에 대해서는 "마감이 31일까지라서 급하게 한다고 누락했다" 라고 해명했다고 합니다.
결과적으로 오픈 소스를 사용했는데 이에 대한 라이선스를 정확하게 명시하지 않은 것은 크게 비판 받고 있는 양상이고, 학습은 자체적으로 했다는 것을 인정하는 추이인 것 같습니다.
다만 국가대표AI 의 기준에 '자체적인 아키텍처' 라는 표현이 있어서 이 해석에 따라 오픈소스를 그대로 쓴 것이 결격 사유가 될 것이냐가 새로운 논쟁거리라고 하네요.
댓글을 작성하려면 로그인이 필요합니다.
from scratch 논쟁 정리 보고서 (초보자용)이 문서는 최근 제기된 **"Solar Open 모델이 정말 from scratch로 학습되었는가?"**라는 논쟁을 초보자도 이해할 수 있도록 양쪽 입장을 정리하고, 마지막에 누구의 주장이 더 합리적인지를 평가한다.
👉 중요한 점:
코드(설계)는 오픈소스를 써도 상관없고, 가중치를 가져왔는지가 핵심 기준이다.
| 용어 | 의미 | from scratch인가? |
|---|---|---|
| Fine-tuning | 기존 모델에 살짝 추가 학습 | ❌ |
| Continued pretraining | 기존 모델을 더 오래 학습 | ❌ |
| Partial reuse | 일부 가중치만 재사용 | ❌ |
| From scratch | 가중치 0부터 전체 학습 | ✅ |
Solar Open 모델은 다음과 같은 큰 구조 변경을 포함한다:
Hybrid MoE (깊이 의존 구조)
RoPE 전략 변경
Normalization 구조 변경
👉 결론적으로:
"이 정도로 구조를 바꿨다면 기존 모델을 재활용했을 가능성은 낮다"
“아키텍처를 바꿨다고 해서 기존 가중치를 안 썼다고 증명되지는 않는다.”
👉 이론적으로는 가능하다는 주장
증거 부족
Tokenizer 정보 부재
코드 계보(lineage)
| 항목 | 입장 A (from scratch) | 입장 B (의심) |
|---|---|---|
| 아키텍처 변경 | 매우 큼 | 변경만으로는 불충분 |
| 기존 weight 호환성 | 거의 없음 | 부분 재사용 가능성 존재 |
| 실무 합리성 | 재사용이 오히려 비효율 | 이론적으로 가능 |
| 증거 제시 | 설계 근거 중심 | 로그·증명 요구 |
입장 A가 훨씬 더 현실적
제안된 partial reuse 시나리오는
👉 실무 관점에서는 from scratch 쪽이 자연스러움
그러나 입장 B의 지적도 형식적으로는 정당
로그·문서가 없으면
기술적으로 보면 Solar Open이 from scratch로 학습되었을 가능성이 매우 높다.
다만, 외부에서 100% 확신하려면 더 많은 증거(학습 로그 등)가 필요하다.
즉,
설계 변경만 놓고 보면 from scratch가 맞고, 증명 자료만 놓고 보면 논쟁의 여지는 남아 있다.
(참고) 이 보고서는 ChatGPT 를 통해 생성한 문서로 기술 비전문가도 이해할 수 있도록 의도적으로 수학·코드·논문 수준의 설명을 생략했습니다.
(참고2) 업스테이지에서 어제 급하게 라이선스 업데이트를 했다는데, 라이선스 누락에 대해서는 "마감이 31일까지라서 급하게 한다고 누락했다" 라고 해명했다고 합니다.
결과적으로 오픈 소스를 사용했는데 이에 대한 라이선스를 정확하게 명시하지 않은 것은 크게 비판 받고 있는 양상이고, 학습은 자체적으로 했다는 것을 인정하는 추이인 것 같습니다.
다만 국가대표AI 의 기준에 '자체적인 아키텍처' 라는 표현이 있어서 이 해석에 따라 오픈소스를 그대로 쓴 것이 결격 사유가 될 것이냐가 새로운 논쟁거리라고 하네요.
댓글을 작성하려면 로그인이 필요합니다.