核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
想深入学习网站后台技术,有哪些建议?
可以随身携带一个Linux系统吗?
新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧?
什么笑话让你看一次笑一次?
电脑有64G的物理内存(DDR5 5200),完全够用了,可以关闭系统的虚拟内存吗?
DLM(扩散语言模型)会成为2025年的Mamba吗?
如何评价 Ubuntu 24.04 LTS?
雷军为什么不愿意用性价比打法进军NAS?
《甄嬛传》中祺贵人为什么和甄嬛反目?
如何看待英伟达新推出的显卡5090dd?
电话:
座机:
邮箱:
地址: