✔ 클로드가 사용자 의도 완전 해결 1위
✔ 챗GPT는 빠른 응답·복수 의도 처리 강점
✔ 퍼플렉시티는 다양한 출처 활용
✔ 그록은 소수 출처에 집중
✔ 실제 사용 기반 대규모 비교 연구 최초 사례
논문: https://share.google/a2sADSopQEEWNphJ8
기사: https://share.google/VOPV7neqDVrA5PE7s
| 항목 | 내용 |
|---|---|
| 대화 수 | 142,808 |
| 총 턴 수 | 660,293 |
| 평균 턴 | 약 4.62 회 |
| 언어 수 | 101개 |
| 플랫폼 | ChatGPT, Claude, Gemini, Grok, Perplexity |
가장 많은 비중: ChatGPT (대부분)
※ 기존 공개 데이터셋 대비 대화가 훨씬 길고 다양함.
| 플랫폼 | 주요 특성 |
|---|---|
| ChatGPT | 전반적 균형 + 빠른 응답 속도 많은 대화 |
| Claude | 복잡한 질의·기술 지원에 강함 |
| Gemini | 비교적 응답 완결성 낮고 편차 큼 |
| Grok | 소셜 미디어 기반 정보 활용 많음, 응답 속도 저하 |
| Perplexity | 외부 출처 인용 다양, 검색형 응답 강조 |
| → 각 챗봇은 기능적 역할과 사용자 니즈 차이로 인해 다른 사용/응답 패턴을 보임. |
✔ 자연스러운 실제 사용자 대화 데이터를 플랫폼 여러 개에 걸쳐 수집.
✔ 단순 정답률 비교를 넘는 대화 완결성, 응답 소스, 시간 분석 등 깊이 있는 측정.
✔ 연구·제품 개선을 위한 대규모 공개 자원 제공.
댓글을 작성하려면 로그인이 필요합니다.
✔ 클로드가 사용자 의도 완전 해결 1위
✔ 챗GPT는 빠른 응답·복수 의도 처리 강점
✔ 퍼플렉시티는 다양한 출처 활용
✔ 그록은 소수 출처에 집중
✔ 실제 사용 기반 대규모 비교 연구 최초 사례
논문: https://share.google/a2sADSopQEEWNphJ8
기사: https://share.google/VOPV7neqDVrA5PE7s
| 항목 | 내용 |
|---|---|
| 대화 수 | 142,808 |
| 총 턴 수 | 660,293 |
| 평균 턴 | 약 4.62 회 |
| 언어 수 | 101개 |
| 플랫폼 | ChatGPT, Claude, Gemini, Grok, Perplexity |
가장 많은 비중: ChatGPT (대부분)
※ 기존 공개 데이터셋 대비 대화가 훨씬 길고 다양함.
| 플랫폼 | 주요 특성 |
|---|---|
| ChatGPT | 전반적 균형 + 빠른 응답 속도 많은 대화 |
| Claude | 복잡한 질의·기술 지원에 강함 |
| Gemini | 비교적 응답 완결성 낮고 편차 큼 |
| Grok | 소셜 미디어 기반 정보 활용 많음, 응답 속도 저하 |
| Perplexity | 외부 출처 인용 다양, 검색형 응답 강조 |
| → 각 챗봇은 기능적 역할과 사용자 니즈 차이로 인해 다른 사용/응답 패턴을 보임. |
✔ 자연스러운 실제 사용자 대화 데이터를 플랫폼 여러 개에 걸쳐 수집.
✔ 단순 정답률 비교를 넘는 대화 완결성, 응답 소스, 시간 분석 등 깊이 있는 측정.
✔ 연구·제품 개선을 위한 대규모 공개 자원 제공.
댓글을 작성하려면 로그인이 필요합니다.