核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
怎么看swift的并发模式选择了actor模型?
如何评价上海七宝中学某高三学生因小三门考了204(总分210),感觉无望清北选择跳楼自杀?
为什么腾讯云或者阿里云不让自建dns服务器?
华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒?
为什么自从 Ti6 以后,CNDOTA 开始给人一蹶不振的感觉?
怎么看待B站舞蹈区和某些风格比较暴露的up?
单依纯的唱功有被过分吹捧吗?
黄一鸣为什么敢承认孩子是王思聪的?
MiniMax 推出全球首个开源大规模混合架构的推理模型 MiniMax-M1,其有何技术优势?
买到烂尾楼到底该有多绝望?
电话:
座机:
邮箱:
地址: