Ollama 基准测试:用于 LLM 性能比较的工具
Ollama Benchmark 是一个免费的 Chrome 扩展,旨在让用户对各种大型语言模型(LLM)进行基准测试和比较,例如 Mistral、LLaMA 和 Qwen。该工具支持同时测试多个模型,使用户能够分析关键性能指标,如令牌数量、响应时间和每秒令牌速度。它具有用户友好的界面,支持本地和远程 API,使其适用于不同的用例。
主要功能包括能够运行基于提示的测试,以多种格式导出结果,包括 .txt、.csv 和 .json,并在本地存储设置和结果。该扩展提供英语和土耳其语版本,确保更广泛的受众可访问性。重要的是,它保证用户隐私,因为在基准测试过程中不会收集任何数据。