大型多模态模型(LMMs)将不断涌现,并在争论中取代LLMs。
2️⃣ GPT-engineer 🧪
- 在简要总结中,将代码块拆分为简单的摘要方面表现出色。当我从其他项目审查代码或需要迅速复习自己的工作时,这非常方便。
CogAgent还提供了可视化代理的能力,能够返回任何给定任务的计划、下一步行动和带有坐标的具体操作。它还增强了与图形用户界面相关的问题解答功能,可以处理与网页、PC应用程序、移动应用程序等任何图形用户界面截图相关的问题。另外,通过改进预培训和微调,CogAgent还增强了OCR相关任务的能力。这些功能的提升使得CogAgent在多个基准测试上实现了最先进的通用性能。
7. 客户服务聊天机器人