# Research Pulse — 2026-06-13 (ssr) _Brown Biotech methodology track · manual curation by Demis_ ## TL;DR [Maier et al. 2025](https://arxiv.org/abs/2510.08338) (PyMC Labs + Colgate-Palmolive, arXiv 2510.08338) — **Likert 1~5 직접 응답의 regression-to-center 문제가 LLM의 본질이 아니라 elicitation 방식의 문제임을 정량 입증**. 텍스트 우회 → 임베딩 코사인 유사도 → 5pt pmf 변환 (Semantic Similarity Rating) 시 human test-retest reliability의 **90%** 까지 도달. **제로샷이 감독학습 LightGBM을 압도** (300 random splits, p<10⁻²⁰). BB SoI positioning — "raw LLM output → structured signal" 의 literal embodiment. ### SSR (Semantic Similarity Rating) — 한 줄 메커니즘 _LLM 응답을 Likert 점수에 *매핑*하지 말고, *분포로 투영*한다._ 1. LLM에게 **자유 텍스트** 응답 생성 (예: "I'm somewhat interested. If it works well and isn't too expensive, I might give it a try.") 2. 텍스트 → OpenAI `text-embedding-3-small` 임베딩 3. 5개 reference anchor (각 Likert 점수당 하나) 와의 **cosine similarity** 계산 4. pmf = (similarity - min_sim) / Σ similarity, ε=0, T=1 5. 6 anchor set 평균 → 최종 분포 LLM의 "regression to 3" 은 elicitation artifact. 텍스트로 우회하면 **분산과 순위 모두 복원**. ### Headline numbers (T=0.5, image stimulus) | Method | ρ (vs 인간 ceiling) | KS similarity | |---|---|---| | Direct Likert (DLR) | 80% | 0.26–0.39 (극도로 좁음) | | Follow-up Likert (FLR) | 85% | 0.72 | | **SSR (Gem-2f / GPT-4o)** | **90%** | **0.80 / 0.88** | | LightGBM (감독학습, in-sample) | 65% | 0.80 | → **제로샷 LLM + SSR > LightGBM**. 학습 데이터 없이도 즉시 deploy 가능. ### 3,579 DEG이 도출한 함의 *PyMC Labs의 "synthetic consumer" vs 전통 consumer panel, 두 개의 다른 AI reasoning layer — 후속 SSR-style 접근이 폭발적으로 늘 것.* - **Free-text 중간 단계** 가 LLM의 *implicit distribution knowledge* 를 surface 시킴 - **합성 panel > 인간 panel** 인 정성적 영역: 정교한 trade-off 명시 (e.g., "ease of use 가 매력적이지만 side effects 우려" 같은 양자택일) - **Demographic conditioning 필수**: 빼면 ρ 92%→50% (분포는 맞지만 product-level signal 약화). Age/income 은 재현 잘 됨, gender/region 은 약함 ### ⚠️ 방법론 한계 — 3 lines _Brown Biotech 적용 시 반드시 인지_ 1. **Reference anchors hand-tuned** for the 57 personal care surveys — cross-domain 일반화 미검증 (논문도 인정) 2. **Training data coupling** — consumer review 풍부한 도메인에서만 작동. sparse B2B/niche 도메인은 hallucination 위험 3. **인간 데이터 분포가 좁음** (σ=0.1) → 절대적 ρ의 의미 약화. "Likert PI ≠ 실제 conversion probability" ### Brown Biotech 통합 — 4 actions | Track | Action | 강도 | |---|---|---| | **SoI positioning** | SSR = "raw output → structured signal" 의 사례. brownbio.tech hero case study | 🟢 HIGH | | **Inventa (KR research partner)** | 한국어 anchor set 45개 설계 + CLOVA X/Naver LLM에서 SSR 재현 검증 | 🟡 MED | | **ARP v27 synthetic expert panel** | 현재 expert persona 평가 narrow distribution → SSR 재설계, correlation attainment 측정 | 🟡 MED | | **Peptide service concept test** | intake 후속 synthetic end-user panel 5-point satisfaction → BB human baseline 비교 | 🟢 HIGH | ### CTA — Brown Biotech로 LLM reasoning의 신뢰성을 **정량**으로 보여줄 수 있는 framework, SSR. Brown Biotech는 이걸 SoI(System of Intelligence)의 reasoning layer 사례 연구로 자사 워크플로우에 통합합니다 — Paid Briefs의 "decision-ready" 신뢰성 마케팅, Inventa의 한국어 synthetic panel first-mover, ARP v27의 synthetic expert panel 평가 강화. **인간 vs LLM 의 합성 비교가 필요한 순간, BB 가 metric 을 줍니다.** **Resources:** - 📄 [arXiv:2510.08338](https://arxiv.org/abs/2510.08338) — full paper - 💻 [github.com/pymc-labs/semantic-similarity-rating](https://github.com/pymc-labs/semantic-similarity-rating) — Python package - 🧠 PRISM RAG: 66 chunks ingested 2026-06-13, index 744→810 vectors - 📚 Notion: [Active Projects DB](https://app.notion.com/p/SSR-Semantic-Similarity-Rating-Maier-et-al-2025-arXiv-2510-08338-37ef273533a481dda9d6d46ee5d32440) - 📑 Deep-dive: `/Users/ocm/openclaw/workspace/arp-v27/literature/SSR_Likert_SyntheticConsumers_Deep_Analysis.md` *#MethodologyTrack #SyntheticConsumer #SoI #LLMReasoning #BrownBiotech #Inventa #ARPV27*
Research Pulse·2026-06-13-ssr
Research Pulse — 2026-06-13-ssr
28 journals × 7 topics · fibrosis · OXPHOS · ferroptosis · sarcopenia · senescence
Raw data + scoring: Daily Tech Digest (separate feed)
Request a Paid Brief