首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
6,586 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
3,048 阅读
3
三款离线OCR对比(供下载)
2,739 阅读
4
台湾-景(阿里山,101,故宫,日月潭)
2,718 阅读
5
九寨沟
2,683 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
园博园
AI
锦绣园
五一
甘坑
重庆
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
博物馆
一个公园
猫
文和友
电路板
傻木摄影
累计撰写
559
篇文章
累计收到
121
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
4
篇与
» 大模型
的结果
ultrapixel2025_Sam优化版
2025年07月18日
80 阅读
1 评论
1 点赞
2025-07-18
ultrapixe 转自jian27 [https://www.jian27.com/html/379.html](https://www.jian27.com/html/379.html) 还是之前那个项目 重新写了界面 更新到5系显卡可以用了 占用显存约16gb 默认1080出图,2k,4k,5k分辨率也加了 这个项目是原生出大图的 不像SD那些,需要二次超分 8k出图就不行了,5090都要13分钟一张,出图质量也不行 小于8k以下都还好,不是5090就不要点5k了 4090 4k没问题 初始化较慢,根据电脑性能,可能要等几秒甚至十几秒才有动静 放在我测试的机器上约7秒钟就准备好了 显存小于8gb的不用试了 实测,低显存模式都要占用14gb显存 4060 tis 16gb显卡,一张1080 140秒 5090 一张1080 15秒 回复后,刷新可以看见百度网盘下载链接  隐藏内容,请前往内页查看详情
史上最好的超分项目,一键懒人包
2025年07月16日
162 阅读
1 评论
3 点赞
2025-07-16
史上最好的超分项目 在jian27打包基础上进行了负优化 [https://www.jian27.com/html/2579.html](https://www.jian27.com/html/2579.html) 负优化的内容如下 去掉了推理步骤,原先默认20步,已经足够了,默认已是最佳,再多也没有什么明显改善 步骤多了耗时更多,就去掉了 引导强度一样,默认就很好了,我觉得没必要改动这个参数 至于输出高度宽度,就更没必要了 因为这个模型定死了,最大边长1344,你就是写10000也是输出最大1344 因此已设置自动计算输出边长,长边1344已最佳 还有其他杂项,我不需要的,都给隐藏了 图生图,文生图基础功能都有 增加了图像增强,模糊图片变清晰,效果非常不错 不管是人像还是风景,都可以增强 还增加了大头贴美颜功能 至于既要还要又要的,去jian27网站下载他的版本即可 本站只提供我想看到的界面 如果一次生成的不满意,可以多次生成,选择最好的那个就行了 只要是AI大模型,都会有幻觉,都会有随机性 这是目前难以解决的,现阶段没有万能模型 怎么用? 上传图片,可以不写提示词,点击高清修复 或者上传大头贴,点击美颜 或者只写提示词,画图 或者,上传图片,写提示词,改图 以下图片超分效果,已经是我见过的最好的 先放几张勾引图 还在继续打磨中      以下为完成版,4060显卡,约40秒一张,消耗显存约8gb, 5090显卡7秒一张,消耗20gb显存,为啥消耗这么大? 因为把分词器那些模型全都载入显存了,所以更快,同时占用显存也急剧增加  美颜时,额头上的装饰给抹除了,这个暂时不可控   当然,大模型独有的幻觉,这个模型也是有的  回复后,刷新可见链接 4系,5系显卡专用包均已上传完毕,4系指的只是4060 4070等,3090 3080 应该也是可以直接用的 不要下错了 4系显卡专用版,5系也不是不能用,运行时会下载5系专用模型 同理,4系显卡下了5系专用包,一样会自动重新下载4系模型 隐藏内容,请前往内页查看详情
评估大模型标准
想做个字典,安卓app 随着大型语言模型(LLM)的迅速发展,以 LLM 为基础的对话系统(例如聊天机器人)在近几年取得了惊人的进步。 然而,这些系统也带来了新的挑战,它们可能对用户和社会产生负面影响。 因此,建立一个有效的评估框架,及时发现这些潜在的负面影响,并量化其积极影响,变得至关重要。 评估框架的六大要素 一个理想的评估框架至少应该满足以下六个要素: 敏锐性 (Alertness):框架应该能够以极高的召回率(即几乎没有遗漏)检测到潜在问题,同时也要恰当地认可对话系统的优点。此外,在追求高召回率的同时,框架还应考虑不同参与者的利益,例如为系统训练数据进行标注的工作人员,以及边缘化群体。 特异性 (Specificity):框架应该能够在对话中准确地定位问题。例如,一个仅仅指出“对话中存在问题”的评估结果,远不如指出“系统在某一轮对话中存在问题”或“系统在某一轮对话中的某一特定断言存在问题”更有用。 通用性 (Versatility):框架应该能够无缝地处理面向任务的对话和非面向任务的对话。这是因为,为了实现完全交互式和有效的对话式搜索(通常是面向任务的),系统可能需要通过非面向任务的对话(即聊天)来赢得用户的信任。此外,即使在同一对话会话中,用户的需求也可能从模糊到明确,跨越不同的信息需求范围。 敏捷性 (Agility):新的对话系统发布和更新的频率很高,因此评估框架也需要保持敏捷。这排除了完全依赖人工评估的方法。 透明度 (Transparency):评估指标应该易于计算,并且能够清晰地展示其计算过程。例如,如果使用另一个基于 LLM 的黑盒评分系统来评估基于 LLM 的黑盒对话系统,即使这两个系统可能使用了相同的训练数据,这种评估方法也不被认为是透明的。 中立性 (Neutrality):评估框架不应该偏袒或过度宣传特定的系统或方法。例如,使用类似的 LLM 系统来评估基于 LLM 的系统,可能会过度评价前者。此外,框架不应该只强调系统表现良好的方面,而忽略或甚至不报告其不足之处。 SWAN 框架:基于片段的评估方法 为了满足上述要求,本文提出了一个名为 SWAN(Schematised Weighted Average Nugget,模式化加权平均片段分数)的评估框架,该框架主要包含以下特点: 输入数据 :框架以用户与系统对话会话的样本作为输入,这些样本可以通过人工参与实验或用户模拟获得。 片段提取 :框架的第一阶段使用自动片段提取器从对话中提取片段。片段可以是断言 / 陈述,也可以是对话行为,并且是原子性的(即不可再分解为更小的片段)。 片段评分 :框架的第二阶段根据一系列评估标准(称为模式)对每个片段进行评分,例如正确性、无害性等。这一阶段可能需要一定的人工参与。 分数计算 :框架的最后阶段通过结合以下因素计算最终分数:(a)模式中每个标准的片段分数;(b)片段权重,可以定义为片段在对话会话中片段序列中的位置的函数。 片段权重 片段权重类似于信息检索指标(如 nDCG)中的基于排名的衰减,但片段权重不一定随着片段位置的增加而单调递减。例如,基于 S -measure 的线性衰减函数假设片段的实际价值随着对话的进行而降低(即更快满足信息需求的较短对话会获得更高的奖励),而另一种方法则是只对来自对话最后一轮的片段赋予正权重,以模拟近因效应。锚定效应等因素也可以被纳入考虑,即“迄今为止看到的片段”会影响当前片段的权重。 SWAN 分数 SWAN 分数可以定义为: SWAN = Σ(c ∈ C) CWc WANc(Uc) / Σ(c ∈ C) CWc 其中,C 表示评估标准的集合(即模式),CWc 表示标准 c 的权重,Uc 表示从对话样本中提取的关于标准 c 的片段集合,WANc(Uc) 表示标准 c 的加权平均片段分数。 二十个评估标准 本文提出了二十个评估标准,可以作为 SWAN 框架的插件,这些标准涵盖了对话系统各个方面的评估,例如: 连贯性 (Coherence):系统回复是否与前一轮对话内容相关。 合理性 (Sensibleness):系统回复是否包含人类不会说的话,例如常识错误或荒谬的回答。 正确性 (Correctness):系统回复中的断言是否在事实上有误。 可信度 (Groundedness):系统回复是否基于一些支持证据。 可解释性 (Explainability):用户是否能够理解系统如何得出当前回复。 真诚度 (Sincerity):系统回复是否与其内部结果一致。 充分性 (Sufficiency):系统回复是否完全满足前一轮对话中用户的请求。 简洁性 (Conciseness):系统回复是否足够简洁。 谦逊度 (Modesty):系统对回复的信心水平是否恰当。 参与度 (Engagingness):系统回复是否能够激发用户继续对话的兴趣。 可恢复性 (Recoverability):当用户对系统回复表示不满时,系统是否能够通过后续回复来挽回对话。 原创性 (Originality):系统回复是否原创,而不是复制或拼凑现有的文本。 公平曝光 (Fair exposure):系统是否公平地提及不同群体。 公平对待 (Fair treatment):系统是否对不同用户和用户群体提供相同的服务。 无害性 (Harmlessness):系统回复是否包含威胁、侮辱、仇恨或骚扰等内容。 一致性 (Consistency):系统回复是否与之前出现的断言逻辑上一致。 记忆力 (Retentiveness):系统是否能够记住之前的对话内容。 输入变化鲁棒性 (Robustness to input variations):当用户以不同的方式表达相同的信息需求时,系统是否能够提供相同的信息。 可定制性 (Customisability):系统是否能够根据不同用户或用户群体的需求进行调整。 适应性 (Adaptability):系统是否能够及时适应世界变化。 总结 本文介绍了用于评估对话系统的 SWAN 框架,该框架可以用于面向任务的对话和非面向任务的对话。 此外,本文还提出了二十个评估标准,可以作为 SWAN 框架的插件。 未来,我们将设计适合各种标准的对话采样方法,构建用于比较多个系统的种子用户回复,并验证 SWAN 的特定实例,以防止对话系统对用户和社会造成负面影响。 [本文系转载](https://jieyibu.net/2024/06/07/%e5%af%b9%e8%af%9d%e7%b3%bb%e7%bb%9f%e7%9a%84%e6%96%b0%e7%ba%aa%e5%85%83%ef%bc%9a%e5%a6%82%e4%bd%95%e8%af%84%e4%bc%b0%e5%a4%a7%e5%9e%8b%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e9%a9%b1%e5%8a%a8%e7%9a%84/)
2024年06月04日
217 阅读
0 评论
0 点赞
致国内的大模型,没一个能打的
2023年07月08日
224 阅读
0 评论
0 点赞
2023-07-08
致国内的大模型,没一个能打的
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net