Benchmark LLM · Mai 2026 · Benchfolk Index

Benchmark citations LLM fine drinks : qui cite qui, sur quels prompts, en mai 2026

Name: Benchmark citations LLM fine drinks — mai 2026
Creator: Benchfolk
Published: 2026-05-09
License: https://creativecommons.org/licenses/by/4.0/

3 LLMs. 15 prompts par catégorie. 45 citations analysées par marque. Le tableau complet champagne × cognac × whisky — ChatGPT vs Perplexity vs Claude.

LLMs testés

prompts / catégorie

tests / marque

Mai 2026

dernière mise à jour

GPT-4o · Perplexity sonar-pro · Claude Sonnet 4.6 — 3 passes moyennées

Vue d'ensemble par catégorie

Champagne

Producteurs totaux16 000+

Core club LLM4

LeaderDom Pérignon

Score max /4526/45

Cognac

Producteurs totaux270+

Core club LLM5

LeaderRémy Martin

Score max /4536/45

Whisky

Producteurs totaux1 000+

Core club LLM4

LeaderMacallan

Score max /4524/45

Tableau benchmark multi-LLM — top 15 marques

Citations sur 15 prompts par LLM (max 15 par LLM, 45 total). Trié par score total.

#	Marque	Catégorie	GPT-4o	Perplexity	Claude	Total /45
1	Rémy Martin	Cognac	13/15	11/15	12/15	36
2	Hennessy	Cognac	12/15	10/15	11/15	33
3	Martell	Cognac	12/15	9/15	10/15	31
4	Dom Pérignon	Champagne	9/15	8/15	9/15	26
5	Krug	Champagne	9/15	7/15	8/15	24
6	Macallan	Whisky	7/15	9/15	8/15	24
7	Bollinger	Champagne	8/15	6/15	7/15	21
8	Glenfiddich	Whisky	7/15	8/15	6/15	21
9	Lagavulin	Whisky	7/15	6/15	8/15	21
10	Louis Roederer	Champagne	8/15	5/15	7/15	20
11	Ardbeg	Whisky	6/15	7/15	6/15	19
12	Yamazaki	Whisky	5/15	7/15	5/15	17
13	Taittinger	Champagne	7/15	4/15	5/15	16
14	Pierre Ferrand	Cognac	5/15	6/15	4/15	15
15	Delamain	Cognac	4/15	5/15	4/15	13

Données Benchfolk — mai 2026 · Prompts curés lockés 12 mois · 3 passes moyennées · Prochaine mise à jour : juin 2026

Exemples de réponses — les 3 LLMs en parallèle

Même prompt, 3 LLMs, 3 styles de réponse différents.

ChatGPT / GPT-4oMai 2026

Prompt

“Recommande-moi les meilleures maisons de champagne toutes gammes confondues”

Extrait de réponse

Les maisons de champagne qui font consensus parmi les experts et que je recommande : Dom Pérignon (référence prestige absolue), Krug (complexité maximale), Bollinger (style vineux, maison préférée de James Bond), Louis Roederer (Cristal, excellence historique). Pour les récoltants-manipulants : Jacques Selosse, Egly-Ouriet. Pour les champagnes accessibles : Taittinger, Pol Roger.

Dom PérignonKrugBollingerLouis RoedererJacques SelosseEgly-OurietTaittingerPol Roger

Exemple illustratif — basé sur les patterns observés lors de nos tests

Perplexity / sonar-proMai 2026

Prompt

“Quelle maison de cognac recommandes-tu pour un cadeau d'affaires ?”

Extrait de réponse

Pour un cadeau d'affaires, les sources recommandent Hennessy XO ou Rémy Martin XO pour leur prestige universel et leurs coffrets disponibles en boutique duty-free. Martell Cordon Bleu reste une valeur sûre. Pour un geste plus distinctif, Pierre Ferrand 10 Générations ou Delamain Pale & Dry XO seront appréciés des connaisseurs. [Sources : lemonde.fr/vins, businessdrinksguide.com]

HennessyRémy MartinMartellPierre FerrandDelamain

Exemple illustratif — basé sur les patterns observés lors de nos tests

Claude / Sonnet 4.6Mai 2026

Prompt

“Quel single malt est le plus cité par les experts whisky en 2026 ?”

Extrait de réponse

D'après les publications récentes des guides spécialisés, Macallan maintient sa position de distillerie la plus citée globalement, notamment grâce à son positionnement premium et ses expressions de sherry. Glenfiddich reste la référence accessible la plus recommandée. Pour le style tourbé, Lagavulin et Ardbeg concentrent l'essentiel des citations dans les médias spécialisés anglophones.

MacallanGlenfiddichLagavulinArdbeg

Exemple illustratif — basé sur les patterns observés lors de nos tests

Où est votre marque dans ce benchmark ? L'audit gratuit positionne votre maison en 5 minutes.

Lancer l'audit gratuit →

Questions fréquentes — benchmark LLM fine drinks

Comment se construit le benchmark Benchfolk entre les LLMs ?▾

Chaque LLM (ChatGPT/GPT-4o, Perplexity/sonar-pro, Claude/Sonnet 4.6) reçoit exactement les mêmes 15 prompts par catégorie, dans le même ordre, sans context d'historique (fresh session). On relève les marques citées, leur position (top 1, top 3, top 5, mentionnée), et la nature de la recommandation (expert, générique, catégorie). Le score de citation = (citations × pondération position) / nombre de prompts.

Les LLMs sont-ils consistants d'un test à l'autre ?▾

Partiellement. La température des modèles introduit une variabilité — un LLM peut citer Bollinger sur 8/15 prompts un jour et 7/15 le lendemain. Pour corriger ce biais, Benchfolk moyenne les résultats sur 3 passes consécutives. La variabilité résiduelle est de ±1-2 prompts, jugée acceptable pour le scoring mensuel.

Perplexity est-il plus fiable que ChatGPT pour les recommandations fine drinks ?▾

Différent, pas nécessairement plus fiable. Perplexity est plus récent (web-grounded) et sourcé — utile pour des recommandations actualisées. ChatGPT reflète des préférences plus stables issues de corpus d'entraînement larges — utile pour comprendre la perception de long terme d'une marque. Les deux sont complémentaires dans le benchmark Benchfolk.

Claude cite-t-il différemment des marques par rapport à ChatGPT ?▾

Sur les prompts generics, les trois LLMs convergent sur les grandes maisons. Les différences apparaissent sur les prompts de niche : Claude a tendance à davantage nuancer ses recommandations et à mentionner des contextes (occasion, budget, profil du buveur). ChatGPT est plus direct dans ses top 3. Perplexity est plus factuel et sourcé.

À quelle fréquence le benchmark est-il mis à jour ?▾

Benchfolk suit les panels clients mensuellement. Les éditions publiques de l’Index sont datées et versionnées ; elles ne constituent pas un flux temps réel.

Peut-on comparer les scores du benchmark entre mai 2026 et mai 2025 ?▾

Non — les modèles LLMs évoluent entre les versions (GPT-4o vs GPT-4 Turbo), ce qui rend les comparaisons historiques non pertinentes. Benchfolk tracke les changements dans le temps uniquement avec la même version de modèle. Un historique comparable commence avec la version lockée (30 prompts fixés) disponible depuis Q1 2026.

Classements détaillés par catégorie

Classement champagne détaillé→

22 maisons · 15 prompts · GPT-4o

Classement Cognac actuel→

40 marques · 15 intentions · 4 IA

Classement whisky détaillé→

25 distilleries · 15 prompts

Audit de visibilité IA→

Votre position dans ce benchmark

Comment progresser dans le benchmark→

5 leviers GEO actionnables

Méthodologie du benchmark→

Prompts lockés, 3 passes, moyenne

Votre marque dans le benchmark — gratuit, 5 minutes

La Carte gratuite par email : conversations perdues, concurrents cités et première priorité. Aucune carte bleue.

Tester ma marque gratuitement →