notesum.ai

Published at December 5

Marco-LLM: Bridging Languages via Massive Multilingual Training for Cross-Lingual Enhancement

cs.CL

Released Date: December 5, 2024

Authors: Lingfeng Ming¹, Bo Zeng, Chenyang Lyu, Tianqi Shi, Yu Zhao, Xue Yang, Yefeng Liu, Yiyu Wang, Linlong Xu, Yangyang Liu, Xiaohu Zhao, Hao Wang, Heng Liu, Hao Zhou, Huifeng Yin, Zifu Shang, Haijun Li, Longyue Wang, Weihua Luo, Kaifu Zhang

Aff.: ¹University

Arxiv: http://arxiv.org/pdf/2412.04003v1

7B Models
Model	AGIEval	Belebele	CEval	Flores	MMLU	TyDiQA	WMT16	XCOPA	XMMLU	XStoryCloze
Qwen2-7B	64.6	73.4	83.0	27.1	71.9	52.3	18.1	70.6	60.2	70.6
Qwen2.5-7B	66.5	72.3	81.4	27.2	75.4	59.9	18.2	73.6	62.6	70.3
Llama3-8B	24.3	55.3	37.5	33.1	53.6	50.5	24.6	71.7	49.7	66.5
Llama3.1-8B	44.9	63.3	52.8	33.4	66.2	57.0	25.8	71.6	49.2	71.7
Marco-7B	68.8	78.8	83.5	35.0	74.4	60.8	29.0	76.6	61.2	71.9
70B+ Models
Qwen2-72B	78.2	86.5	90.4	38.7	83.8	58.7	30.2	80.9	78.5	77.1
Qwen2.5-72B	80.8	87.6	90.6	35.0	86.3	63.7	31.0	84.7	79.9	76.3
Llama3-70B	60.6	85.5	66.8	37.4	79.2	64.3	34.3	81.1	72.0	76.9
Llama3.1-70B	61.7	86.2	67.3	36.9	78.8	62.8	35.0	83.0	71.4	75.4
Marco-72B	84.4	90.0	93.7	45.0	86.3	62.7	35.1	85.7	81.2	78.7