저는 입찰 플랫폼을 기획 중인 기획자입니다. 입찰 플랫폼을 기획하다 보면 "왜 입찰(투찰)이 안 되지?"라는 고민에 빠집니다. 엑셀로 '투찰 시간' 따로, '낙찰 금액' 따로 볼 때는 안 보였던 문제들이, AI에게 데이터를 통째로 던져주니 비로소 보이기 시작했습니다. 이 레시피는 통계를 잘 모르는 기획자가 품목수, 투찰시간, 낙찰가액 등 복잡한 변수들을 AI(ChatGPT)와 함께 분석하여, 사용자 행동 패턴을 시각적으로 파악하고 서비스 개선 전략까지 도출한 실제 사례입니다.
문제 정의: "왜 입찰을 안 할까?" (엑셀의 한계)
상황: 입찰 수가 계속 낮은데, 단순한 지표(예: 시간이 늦어서? 금액이 낮아서?)만으로는 설명이 안 되는 상황입니다.
목표: 단편적인 원인 찾기를 멈추고, 여러 변수(품목수, 시간, 금액 등)가 복합적으로 어떻게 작용하는지 파악하기 위해 데이터를 준비합니다.
[준비] 데이터 정리 (Data Cleaning)
이유: AI에게 밥상을 차려주기 전, 상한 음식(이상한 데이터)을 골라내는 과정입니다.
💬 프롬프트 예시:
입찰 관련 데이터(품목수, 투찰시간, 낙찰가액, 투찰수)가 담긴 CSV 파일을 업로드했어. 본격적인 분석 전에, 데이터에 빈 값이나 분석을 방해할 만한 이상한 수치가 있는지 확인하고, 있다면 초보자도 알기 쉽게 처리 방법을 알려줘.
👉 결측치 (데이터 누락), 이상데이터 (중복데이터 등)을 찾아내주고, 해당 데이터를 제거할지, 혹은 평균값으로 대체할지 등을 AI가 제안해줍니다. 저는 분석 오류를 막기위해 이런 데이터는 삭제하는 과정을 진행했습니다.
관계 파악: 변수들이 서로 짠 듯이 움직인다? (전체 상관관계)
이유: 엑셀에선 A와 B만 비교했지만, 이제 모든 변수(품목수, 시간, 금액, 투찰수)를 한 번에 펼쳐 놓고 서로 얽힌 관계를 봅니다.
💬 프롬프트 예시:
투찰이 잘 되는 조건을 찾고 싶어. '품목수', '투찰시간', '낙찰가액'이 '투찰수'와 각각 어떤 관계가 있는지 알고 싶어. 1. 모든 변수 간의 관계를 한눈에 볼 수 있게 'nxn matrix' 형태로 상관관계를 구해줘. 2. 서로 강하게 영향을 주고받는 변수들이 무엇인지 쉽게 설명해줘.
👉 이 단계에서 "어떤 변수들이 서로 묶여서 움직이는지" 감을 잡을 수 있습니다.
👉 어떤 데이터는 너무 강하게 연결되어 두 변수 중 하나를 제거하는 것이 좋을 수 도 있습니다. (AI에게 물어보고 삭제해보세요)
핵심 축 찾기: 데이터를 관통하는 '보이지 않는 흐름' 발견 (PCA)
이유: 변수가 많아 복잡할 때, AI에게 "그래서 이 데이터를 설명하는 핵심 특징(축)이 뭐야?"라고 묻는 과정입니다. 제 경험상 [가격/규모]와 [시간/진입장벽] 같은 변수들의 집합으로 표현할 수 있는 숨은 성격을 발견할 수 있었습니다.
💬 프롬프트 예시:
데이터가 너무 복잡하니까, 주성분 분석(PCA)을 통해 핵심적인 특징을 2가지 축으로 요약해줘. [중요] 분석 후 그래프를 그려주고, 가로축(PC1)과 세로축(PC2)이 우리 비즈니스(입찰) 관점에서 각각 어떤 의미(예: 가격 민감도, 시간적 여유 등)를 나타내는지 해석해줘.
👉 PCA를 진행하면 특정 수식이 나타납니다. 수식에서 보여주는 가중치의 의미를 AI에게 질의하면서 좀더 깊은 이해를 할 수 있습니다.
👉 PC1, PC2 등을 통해 어렴풋이 느끼던 무언가를 하나의 단어나 특징으로 AI 가 정리해줄 수 있습니다.
고객 분류: 행동 패턴으로 '끼리끼리' 묶기 (Clustering)
이유: 전체를 뭉뚱그려 보지 않고, 행동 패턴이 비슷한 사용자끼리 그룹을 나눕니다. (예: 상위 20% 헤비 유저 vs 눈팅 유저)
💬 프롬프트 예시:
위에서 찾은 PCA 결과를 바탕으로 사용자를 3~4개 그룹으로 나누어줘(Clustering). 각 그룹을 CSV로 정리해주고, 각 그룹이 어떤 특징(예: 금액은 큰데 투찰은 안 함 등)을 가졌는지 마케팅팀이 이해하기 쉬운 '별명(페르소나)'을 붙여 설명해줘.
👉 Clustering을 하는 그룹의 수를 조절해보면 새로운 그룹이 나타날 수도 있습니다.
👉 나눈 그룹별 데이터의 평균이나 분포를 그래프로 그려보면 새로운 특징을 발견할 수 있습니다.
액션 플랜: "어떤 그룹의 어떤 장벽을 없앨까?"
이유: 단순히 "투찰이 안 돼"가 아니라, "A그룹은 시간이 문제고, B그룹은 금액이 문제구나"를 분석하고, B그룹을 A그룹으로 이동시키기 위한 주요 변수가 무엇인지 찾아봅니다.
💬 프롬프트 예시:
우리의 목표는 '투찰수'를 높이는 거야. 투찰률이 낮은 'B그룹'을 투찰률이 높은 'A그룹'처럼 행동하게 만들려면, 우리가 어떤 변수(예: 가격 할인, 시간 연장 등)를 건드리는 게 가장 효과적일지 시뮬레이션해주고 어떤 기능이나 정책을 넣으면 좋을지 추천해줘
👉 AI 가 저희 서비스를 이해하고 있거나 운영 정책을 이해하고 있다면, 새로운 아이디어를 줄지도 모릅니다.
정리하며
위에서 예시로 넣은 프롬프트는 정말 기본적인 형태의 프롬프트 입니다.
위 내용을 좀더 단계별로 심화하고 질문을 구체화한다면 더 좋은 결과를 얻을 수 있을 것이라고 생각하며, 수많은 변수들에 압도되어 데이터 분석을 망설였던 분들을 위하여 소개드리는 글이니 업무에 도움이 되셨으면 좋겠습니다.
댓글을 작성하려면 로그인이 필요합니다.
저는 입찰 플랫폼을 기획 중인 기획자입니다. 입찰 플랫폼을 기획하다 보면 "왜 입찰(투찰)이 안 되지?"라는 고민에 빠집니다. 엑셀로 '투찰 시간' 따로, '낙찰 금액' 따로 볼 때는 안 보였던 문제들이, AI에게 데이터를 통째로 던져주니 비로소 보이기 시작했습니다. 이 레시피는 통계를 잘 모르는 기획자가 품목수, 투찰시간, 낙찰가액 등 복잡한 변수들을 AI(ChatGPT)와 함께 분석하여, 사용자 행동 패턴을 시각적으로 파악하고 서비스 개선 전략까지 도출한 실제 사례입니다.
문제 정의: "왜 입찰을 안 할까?" (엑셀의 한계)
상황: 입찰 수가 계속 낮은데, 단순한 지표(예: 시간이 늦어서? 금액이 낮아서?)만으로는 설명이 안 되는 상황입니다.
목표: 단편적인 원인 찾기를 멈추고, 여러 변수(품목수, 시간, 금액 등)가 복합적으로 어떻게 작용하는지 파악하기 위해 데이터를 준비합니다.
[준비] 데이터 정리 (Data Cleaning)
이유: AI에게 밥상을 차려주기 전, 상한 음식(이상한 데이터)을 골라내는 과정입니다.
💬 프롬프트 예시:
입찰 관련 데이터(품목수, 투찰시간, 낙찰가액, 투찰수)가 담긴 CSV 파일을 업로드했어. 본격적인 분석 전에, 데이터에 빈 값이나 분석을 방해할 만한 이상한 수치가 있는지 확인하고, 있다면 초보자도 알기 쉽게 처리 방법을 알려줘.
👉 결측치 (데이터 누락), 이상데이터 (중복데이터 등)을 찾아내주고, 해당 데이터를 제거할지, 혹은 평균값으로 대체할지 등을 AI가 제안해줍니다. 저는 분석 오류를 막기위해 이런 데이터는 삭제하는 과정을 진행했습니다.
관계 파악: 변수들이 서로 짠 듯이 움직인다? (전체 상관관계)
이유: 엑셀에선 A와 B만 비교했지만, 이제 모든 변수(품목수, 시간, 금액, 투찰수)를 한 번에 펼쳐 놓고 서로 얽힌 관계를 봅니다.
💬 프롬프트 예시:
투찰이 잘 되는 조건을 찾고 싶어. '품목수', '투찰시간', '낙찰가액'이 '투찰수'와 각각 어떤 관계가 있는지 알고 싶어. 1. 모든 변수 간의 관계를 한눈에 볼 수 있게 'nxn matrix' 형태로 상관관계를 구해줘. 2. 서로 강하게 영향을 주고받는 변수들이 무엇인지 쉽게 설명해줘.
👉 이 단계에서 "어떤 변수들이 서로 묶여서 움직이는지" 감을 잡을 수 있습니다.
👉 어떤 데이터는 너무 강하게 연결되어 두 변수 중 하나를 제거하는 것이 좋을 수 도 있습니다. (AI에게 물어보고 삭제해보세요)
핵심 축 찾기: 데이터를 관통하는 '보이지 않는 흐름' 발견 (PCA)
이유: 변수가 많아 복잡할 때, AI에게 "그래서 이 데이터를 설명하는 핵심 특징(축)이 뭐야?"라고 묻는 과정입니다. 제 경험상 [가격/규모]와 [시간/진입장벽] 같은 변수들의 집합으로 표현할 수 있는 숨은 성격을 발견할 수 있었습니다.
💬 프롬프트 예시:
데이터가 너무 복잡하니까, 주성분 분석(PCA)을 통해 핵심적인 특징을 2가지 축으로 요약해줘. [중요] 분석 후 그래프를 그려주고, 가로축(PC1)과 세로축(PC2)이 우리 비즈니스(입찰) 관점에서 각각 어떤 의미(예: 가격 민감도, 시간적 여유 등)를 나타내는지 해석해줘.
👉 PCA를 진행하면 특정 수식이 나타납니다. 수식에서 보여주는 가중치의 의미를 AI에게 질의하면서 좀더 깊은 이해를 할 수 있습니다.
👉 PC1, PC2 등을 통해 어렴풋이 느끼던 무언가를 하나의 단어나 특징으로 AI 가 정리해줄 수 있습니다.
고객 분류: 행동 패턴으로 '끼리끼리' 묶기 (Clustering)
이유: 전체를 뭉뚱그려 보지 않고, 행동 패턴이 비슷한 사용자끼리 그룹을 나눕니다. (예: 상위 20% 헤비 유저 vs 눈팅 유저)
💬 프롬프트 예시:
위에서 찾은 PCA 결과를 바탕으로 사용자를 3~4개 그룹으로 나누어줘(Clustering). 각 그룹을 CSV로 정리해주고, 각 그룹이 어떤 특징(예: 금액은 큰데 투찰은 안 함 등)을 가졌는지 마케팅팀이 이해하기 쉬운 '별명(페르소나)'을 붙여 설명해줘.
👉 Clustering을 하는 그룹의 수를 조절해보면 새로운 그룹이 나타날 수도 있습니다.
👉 나눈 그룹별 데이터의 평균이나 분포를 그래프로 그려보면 새로운 특징을 발견할 수 있습니다.
액션 플랜: "어떤 그룹의 어떤 장벽을 없앨까?"
이유: 단순히 "투찰이 안 돼"가 아니라, "A그룹은 시간이 문제고, B그룹은 금액이 문제구나"를 분석하고, B그룹을 A그룹으로 이동시키기 위한 주요 변수가 무엇인지 찾아봅니다.
💬 프롬프트 예시:
우리의 목표는 '투찰수'를 높이는 거야. 투찰률이 낮은 'B그룹'을 투찰률이 높은 'A그룹'처럼 행동하게 만들려면, 우리가 어떤 변수(예: 가격 할인, 시간 연장 등)를 건드리는 게 가장 효과적일지 시뮬레이션해주고 어떤 기능이나 정책을 넣으면 좋을지 추천해줘
👉 AI 가 저희 서비스를 이해하고 있거나 운영 정책을 이해하고 있다면, 새로운 아이디어를 줄지도 모릅니다.
정리하며
위에서 예시로 넣은 프롬프트는 정말 기본적인 형태의 프롬프트 입니다.
위 내용을 좀더 단계별로 심화하고 질문을 구체화한다면 더 좋은 결과를 얻을 수 있을 것이라고 생각하며, 수많은 변수들에 압도되어 데이터 분석을 망설였던 분들을 위하여 소개드리는 글이니 업무에 도움이 되셨으면 좋겠습니다.
댓글을 작성하려면 로그인이 필요합니다.