Benchfolk

Benchmark LLM · Mai 2026 · Benchfolk Index

Benchmark citations LLM fine drinks : qui cite qui, sur quels prompts, en mai 2026

3 LLMs. 15 prompts par catégorie. 45 citations analysées par marque. Le tableau complet champagne × cognac × whisky — ChatGPT vs Perplexity vs Claude.

3
LLMs testés
15
prompts / catégorie
45
tests / marque
Mai 2026
dernière mise à jour

GPT-4o · Perplexity sonar-pro · Claude Sonnet 4.6 — 3 passes moyennées

Vue d'ensemble par catégorie

Champagne
Producteurs totaux16 000+
Core club LLM4
LeaderDom Pérignon
Score max /4526/45
Cognac
Producteurs totaux270+
Core club LLM5
LeaderRémy Martin
Score max /4536/45
Whisky
Producteurs totaux1 000+
Core club LLM4
LeaderMacallan
Score max /4524/45

Tableau benchmark multi-LLM — top 15 marques

Citations sur 15 prompts par LLM (max 15 par LLM, 45 total). Trié par score total.

#MarqueGPT-4oPerplexityClaudeTotal /45
1
Rémy Martin
13/1511/1512/1536
2
Hennessy
12/1510/1511/1533
3
Martell
12/159/1510/1531
4
Dom Pérignon
9/158/159/1526
5
Krug
9/157/158/1524
6
Macallan
7/159/158/1524
7
Bollinger
8/156/157/1521
8
Glenfiddich
7/158/156/1521
9
Lagavulin
7/156/158/1521
10
Louis Roederer
8/155/157/1520
11
Ardbeg
6/157/156/1519
12
Yamazaki
5/157/155/1517
13
Taittinger
7/154/155/1516
14
Pierre Ferrand
5/156/154/1515
15
Delamain
4/155/154/1513

Données Benchfolk — mai 2026 · Prompts curés lockés 12 mois · 3 passes moyennées · Prochaine mise à jour : juin 2026

Exemples de réponses — les 3 LLMs en parallèle

Même prompt, 3 LLMs, 3 styles de réponse différents.

ChatGPT / GPT-4oMai 2026

Prompt

Recommande-moi les meilleures maisons de champagne toutes gammes confondues

Extrait de réponse

Les maisons de champagne qui font consensus parmi les experts et que je recommande : Dom Pérignon (référence prestige absolue), Krug (complexité maximale), Bollinger (style vineux, maison préférée de James Bond), Louis Roederer (Cristal, excellence historique). Pour les récoltants-manipulants : Jacques Selosse, Egly-Ouriet. Pour les champagnes accessibles : Taittinger, Pol Roger.

Dom PérignonKrugBollingerLouis RoedererJacques SelosseEgly-OurietTaittingerPol Roger

Exemple illustratif — basé sur les patterns observés lors de nos tests

Perplexity / sonar-proMai 2026

Prompt

Quelle maison de cognac recommandes-tu pour un cadeau d'affaires ?

Extrait de réponse

Pour un cadeau d'affaires, les sources recommandent Hennessy XO ou Rémy Martin XO pour leur prestige universel et leurs coffrets disponibles en boutique duty-free. Martell Cordon Bleu reste une valeur sûre. Pour un geste plus distinctif, Pierre Ferrand 10 Générations ou Delamain Pale & Dry XO seront appréciés des connaisseurs. [Sources : lemonde.fr/vins, businessdrinksguide.com]

HennessyRémy MartinMartellPierre FerrandDelamain

Exemple illustratif — basé sur les patterns observés lors de nos tests

Claude / Sonnet 4.6Mai 2026

Prompt

Quel single malt est le plus cité par les experts whisky en 2026 ?

Extrait de réponse

D'après les publications récentes des guides spécialisés, Macallan maintient sa position de distillerie la plus citée globalement, notamment grâce à son positionnement premium et ses expressions de sherry. Glenfiddich reste la référence accessible la plus recommandée. Pour le style tourbé, Lagavulin et Ardbeg concentrent l'essentiel des citations dans les médias spécialisés anglophones.

MacallanGlenfiddichLagavulinArdbeg

Exemple illustratif — basé sur les patterns observés lors de nos tests

Où est votre marque dans ce benchmark ? L'audit gratuit positionne votre maison en 5 minutes.

Lancer l'audit gratuit →

Questions fréquentes — benchmark LLM fine drinks

Comment se construit le benchmark Benchfolk entre les LLMs ?

Chaque LLM (ChatGPT/GPT-4o, Perplexity/sonar-pro, Claude/Sonnet 4.6) reçoit exactement les mêmes 15 prompts par catégorie, dans le même ordre, sans context d'historique (fresh session). On relève les marques citées, leur position (top 1, top 3, top 5, mentionnée), et la nature de la recommandation (expert, générique, catégorie). Le score de citation = (citations × pondération position) / nombre de prompts.

Les LLMs sont-ils consistants d'un test à l'autre ?

Partiellement. La température des modèles introduit une variabilité — un LLM peut citer Bollinger sur 8/15 prompts un jour et 7/15 le lendemain. Pour corriger ce biais, Benchfolk moyenne les résultats sur 3 passes consécutives. La variabilité résiduelle est de ±1-2 prompts, jugée acceptable pour le scoring mensuel.

Perplexity est-il plus fiable que ChatGPT pour les recommandations fine drinks ?

Différent, pas nécessairement plus fiable. Perplexity est plus récent (web-grounded) et sourcé — utile pour des recommandations actualisées. ChatGPT reflète des préférences plus stables issues de corpus d'entraînement larges — utile pour comprendre la perception de long terme d'une marque. Les deux sont complémentaires dans le benchmark Benchfolk.

Claude cite-t-il différemment des marques par rapport à ChatGPT ?

Sur les prompts generics, les trois LLMs convergent sur les grandes maisons. Les différences apparaissent sur les prompts de niche : Claude a tendance à davantage nuancer ses recommandations et à mentionner des contextes (occasion, budget, profil du buveur). ChatGPT est plus direct dans ses top 3. Perplexity est plus factuel et sourcé.

À quelle fréquence le benchmark est-il mis à jour ?

Le benchmark public Benchfolk est mis à jour mensuellement. La prochaine mise à jour est prévue pour juin 2026. Les clients abonnés reçoivent leur benchmark en temps réel (mise à jour hebdomadaire ou quotidienne selon le plan).

Peut-on comparer les scores du benchmark entre mai 2026 et mai 2025 ?

Non — les modèles LLMs évoluent entre les versions (GPT-4o vs GPT-4 Turbo), ce qui rend les comparaisons historiques non pertinentes. Benchfolk tracke les changements dans le temps uniquement avec la même version de modèle. Un historique comparable commence avec la version lockée (30 prompts fixés) disponible depuis Q1 2026.

Classements détaillés par catégorie

Votre marque dans le benchmark — gratuit, 5 minutes

Audit gratuit en 5 minutes. Score Benchfolk + position vs le benchmark sectoriel. Aucune carte bleue.

Tester ma marque gratuitement →