Frameout은 이용자의 개인정보를 소중히 여기며, 개인정보 보호법 등 관련 법령을 준수합니다. 수집된 개인정보는 서비스 제공 및 상담, 제안서 접수 등 정해진 목적 외에는 사용되지않습니다. 또한, 이용자의 동의 없이는 개인정보를 외부에 제공하지 않습니다.
Frameout은 입사지원 및 제안 요청/상담을 위해 이름, 연락처, 이메일 주소 등의 정보를 수집합니다. 수집된 정보는 입사지원 및 채용전형 진행, 입사지원정보 검증을 위한 제반 절차 수행과 제안서 작성, 상담 응대 등 업무 처리 목적에 한해 이용됩니다. 해당 정보는 제3자에게 제공하거나 입사 진행 절차 이외에는 사용하지 않습니다. 이용자는 개인정보 제공에 동의하지 않을 수 있으며, 미동의 시 일부 서비스 이용이 제한될 수 있습니다.
수집된 개인정보는 수집 목적 달성 후 즉시 파기되며, 보관이 필요한 경우 관련 법령에 따라 일정 기간 보관됩니다. 기본 보유 기간은 1년이며, 이후에는 지체 없이 안전하게 삭제됩니다. 이용자는 언제든지 개인정보 삭제 요청이 가능합니다.
작성처: 프레임아웃 AX Center
이 프로젝트는 거창한 비전이 아니라 현장의 불편에서 시작됐다. LLM마다 최상위 모델이 있고 ‘딥리서치’에 준하는 심층 분석 기능이 있는데, 그 강점이 제각각이다. 어떤 모델은 보고서 구조화에, 어떤 모델은 전략과 카피라이팅에, 어떤 모델은 추론의 깊이와 정량 분석에 강하다. 문제는 이 강점을 끌어내려면 모델별 특성을 알고 그에 맞는 프롬프트를 줄 수 있어야 한다는 점이다. 결국 같은 도구를 써도 임직원 개인의 경험치에 따라 결과물의 편차가 크게 벌어진다. APNALYST(앞날리스트)의 출발점은 여기였다 — 개인의 숙련도에 의존하는 이 편차를, 재현 가능한 시스템 구조로 옮길 수 없을까.
편차 문제의 이면에는 더 근본적인 약점이 있다. 단일 모델에 한 번 묻는 방식은 검증이 불가능하다. “분석 결과 80% 확률로 상승”이라는 문장은 그럴듯하지만, 그 80%가 어떤 가정 위에 서 있는지, 어디서 틀릴 수 있는지, 그 모델 특유의 편향이 한 방향으로 쏠린 결과는 아닌지를 가려낼 수 없다. APNALYST의 핵심 가설은 단순하다 — 서로 다른 기반 모델 위의 독립 분석이 같은 사안을 두고 충돌하고, 서로의 결론을 들여다볼 때, 단일 분석이 놓치는 지점이 드러나고 모델 편향이 서로를 상쇄한다.
흔한 오해는 각 AI 팀에 고정된 방법론이 있을 거라는 것이다. APNALYST는 그렇게 설계하지 않았다. 주제가 들어오면 각 팀의 LLM이 그 사안에 가장 적합한 학술 방법론을 스스로 선택하고, 선택한 방법론이 요구하는 형태로 하위 에이전트들을 구성한다. “방법론이 아키텍처를 결정한다”는 원칙이다. 그래서 같은 팀이라도 다루는 주제에 따라 베이지안 추론을 쓰기도 하고 시계열 모델을 쓰기도 한다. 어떤 주제에서는 네 팀이 제각각 다른 방법론을 택해 네 개의 렌즈가 충돌하고, 또 어떤 주제에서는 모든 팀이 같은 방법론을 선택하기도 한다 — 후자의 경우, 같은 접근법을 쓰고도 결론이 갈린다면 그 차이는 방법론이 아니라 모델과 데이터 해석의 차이에서 온 것이므로, 그 자체가 의미 있는 신호가 된다.
선택 가능한 방법론은 학술 레퍼런스에 기반한다. Multi-Agent Debate(Du et al. 2024, deliberating crowds), Bayesian Inference(Gelman, BDA), Time Series(Box-Jenkins ARIMA·LSTM), Sentiment + Behavioral Finance(Tetlock 2007, Shiller 2017), Agentic Tool Use + RAG 등이 후보군이며, 사안의 성격에 따라 조합된다. 개인이 프롬프트를 얼마나 잘 짜느냐에 좌우되던 변수를, 방법론 선택과 에이전트 자동 구성이라는 재현 가능한 절차로 옮긴 것이다.
네 팀은 서로 다른 기반 모델 위에서 움직인다.
각 팀의 예측은 LLM에게 “어떻게 생각하느냐”고 묻는 것이 아니라, 방법론을 실제로 실행해 나온 값이다. 모든 팀은 공통의 6단계를 거친다. 단계 1에서 모호한 질문을 측정 가능한 형태로 정제하고(결과 공간·측정 단위·판정 소스·분쟁 시나리오 명시), 단계 2에서 한국은행 ECOS, 통계청 KOSIS, 기상청 OpenAPI 등 외부 데이터와 문서를 광범위하게 수집한다. 단계 3에서 선택한 방법론을 도구·정량 계산과 결합해 독립 분석하고, 단계 4에서 헤드와 분석가가 다회 라운드의 내부 토론·critique로 self-review를 수행한다. 단계 5에서 과거 calibration 기록과 대조해 확신도를 보정하고, 단계 6에서 1차 예측과 근거를 리포트로 산출한다. 추측을 문장으로 포장하지 않고, 실제로 돌린 분석의 출력만 리포트에 담는 것이 원칙이다.
여기까지는 네 팀이 각자 독립적으로 진행한다. 핵심은 그다음이다. 네 팀의 1차 분석 보고서가 완성되면, 각 팀은 다른 세 팀의 보고서를 모두 열람할 수 있게 된다. 그리고 그 내용을 반영해 자기 보고서를 한 차례 자가 수정한다. 다른 팀이 포착한 변수를 내가 놓쳤는지, 내 가정이 다른 세 관점 앞에서도 버티는지를 스스로 검토하는 단계다. 이 과정을 거쳐 비로소 네 개 팀의 최종 보고서 4종이 확정된다. 독립성을 유지하되, 폐쇄된 독립이 아니라 서로를 본 뒤 갱신된 독립이다.
최종 보고서 4종이 나오면 그대로 합산하지 않는다. 단순 평균은 종종 개별 예측보다 못하기 때문이다. 별도의 종합 편집자 역할을 맡은 LLM(현재 Claude)이 네 보고서를 읽고 이견의 지점과 합의의 지점을 구조화해 1차 종합 완성본을 작성한다. 그리고 한 단계를 더 둔다. 종합을 맡은 모델 역시 자기 계열의 편향을 가질 수 있으므로, 서로 다른 계열의 모델(현재 GPT)이 그 1차 완성본을 2차로 감사한다. 특정 관점이 과대·과소 반영되지 않았는지, 근거 없이 한쪽으로 기운 서술은 없는지를 교차 점검한 뒤에야 최종 완성본이 된다.
전체 흐름을 정리하면 이렇다 — 주제 인입 → 팀별 방법론 선택과 하위 에이전트 구성 → 6단계 독립 분석으로 1차 보고서 → 타 팀 보고서 열람 후 자가 수정 → 최종 보고서 4종 확정 → 종합 편집자의 1차 완성본 → 이종 모델의 2차 감사 → 최종 완성본. 개인의 숙련도에 따라 출렁이던 품질이, 이 파이프라인을 통과하면서 재현 가능한 수준으로 수렴한다.
예측 서비스의 가장 흔한 함정은 맞은 것만 기억되는 구조다. APNALYST의 모든 예측은 시점을 박제하고, 실제 결과가 나오면 팀별 정확도(skill score)와 적중 이력이 공개된다. 잘 맞힌 팀도 못 맞힌 팀도 같은 표에 오른다. 매일 무료로 공개하는 예측 리포트가 곧 영업 자료라는 입장은 여기서 나온다. 광고가 아니라 누구나 검증할 수 있는 실적으로 신뢰를 쌓는 구조이고, 정확도가 음수인 기록도 지우지 않는다.
공개 예측이 방법론의 증거라면, B2B 맞춤 분석은 같은 엔진을 비공개 사안에 적용한 것이다. 차이는 셋뿐이다 — 기업·기관의 비공개 질문을, 그들의 내부 자료와 결합해, 기간 단위로 추적한다. 1회성 보고서가 아니라 분기·반기·연 단위 구독으로 하나의 사안을 지속 갱신하며, 구독 기간·분석 범위·제공 데이터·거버넌스 등급의 네 축을 조합해 함께 설계한다. 금융·공공처럼 규제가 강한 환경에서는 민감 자료의 격리·보안 수준을 별도로 조정한다.
활용처는 의사결정 보조에 집중된다. 기업 전략·리스크팀은 내부 가정을 외부의 독립 분석과 대조하고, 금융권 애널리스트는 거시·산업 변수의 확률적 전망을 이해상충 없는 제3의 시각으로 확보하며, 공공·연구기관은 정책·환경 변수의 시나리오별 확률과 논거를 받는다. APNALYST에는 중개·자문 수익이 없어 한쪽으로 기울 이유가 없고, 그래서 매수·매도를 권하지 않고 확률과 근거만 제공한다. 분석이지 투자 권유가 아니라는 경계는 여기서 비롯된다.
APNALYST는 무엇이든 예측하지 않는다. 금전 베팅, 선거·정치 예측, 개인 사생활, 의료·진단, 주식·가상자산의 정확한 가격 예측은 처음부터 범위에서 제외했다. 법적·윤리적 경계 안에서 검증 가능한 사안에만 집중한다. “AI가 무엇이든 예측할 수 있다”가 아니라 “무엇을 예측해도 되는가”를 먼저 정의한 제품이라는 점이, 의사결정 도구로서의 신뢰를 떠받친다.
멀티에이전트 토론이 단일 모델보다 실제로 더 정확한지, 학술 방법론이 한국 도메인에서 어디까지 작동하는지는 완결된 결론이 아니라 매일의 예측으로 누적·검증되는 가설이다. APNALYST는 그 검증 과정을 숨기지 않는다. AI의 판단을 의사결정에 쓸 수 있으려면, 결국 그 판단이 얼마나 투명하게 검증되었는가가 전제가 되어야 한다.
AI 4개 팀의 열띤 토론은 유튜브 영상을 통해 확인할 수 있습니다.
https://www.youtube.com/@APNALYST
맞춤 분석 문의
https://apnalyst.com/business
Where AI Drives UX, FRAMEOUT