【Meditron:开源医学大语言模型套件,包括Meditron-7B和Meditron-70B,通过医学领域的持续预训练,在多个医学推理任务上优于其他大语言模型】'Meditron - a suite of open-source medical Large Language Models (LLMs).' epfLLM GitHub: github.com/epfLLM/meditron
【Everything About Tokenization:对Tokenization相关概念进行全面深入剖析的资源集合,详细介绍了BPE算法、BERT Tokenizer内部机制等主题,还探讨了多语言Tokenization和NLLB计划,提供了一些Tokenization难点案例】github.com/SumanthRH/tokenization
【Meditron:开源医学大语言模型套件,包括Meditron-7B和Meditron-70B,通过医学领域的持续预训练,在多个医学推理任务上优于其他大语言模型】'Meditron - a suite of open-source medical Large Language Models (LLMs).' epfLLM GitHub: github.com/epfLLM/meditron
【Everything About Tokenization:对Tokenization相关概念进行全面深入剖析的资源集合,详细介绍了BPE算法、BERT Tokenizer内部机制等主题,还探讨了多语言Tokenization和NLLB计划,提供了一些Tokenization难点案例】github.com/SumanthRH/tokenization