ETNet 新聞

【ＡＩ】美團LongCat團隊發布並開源VitaBench大模型評測基準

21 10 月, 2025

One Min Read

7 Views

《經濟通通訊社２１日專訊》美團ＬｏｎｇＣａｔ團隊２０日正式發布當前高度貼近真實生
活場景、面向複雜問題的大模型智能體評測基準－－ＶｉｔａＢｅｎｃｈ（Ｖｅｒｓａｔｉｌｅ
ＩｎｔｅｒａｃｔｉｖｅＴａｓｋｓＢｅｎｃｈｍａｒｋ），並已全面開源。

據官方介紹，ＶｉｔａＢｅｎｃｈ以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景
為典型載體，構建了包含６６個工具的交互式評測環境，並進行了跨場景的綜

Last Update: 21 10 月, 2025

Written By

Other Articles

Previous

【聚焦人幣】人幣中間價升４３點子，報７﹒０９３０，創逾一年高

Next

【人行操作】人行１５９５億逆回購利率持平，淨投放６８５億

Related Posts

《傳聞》五一假期旅遊預訂火熱；內地家電消費表現不俗

1 Min Read

《傳聞》跨境電商交易大增；內地工業發電量增

1 Min Read

《魚缸博客》復活節有無返內地玩？福田南山真係周圍都係人！

1 Min Read

Our site uses cookies. By using this site, you agree to the Privacy Policy and Terms of Use.

Accept