首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
九寨沟
2,209 阅读
2
台湾-景(阿里山,101,故宫,日月潭)
2,057 阅读
3
三款离线OCR对比(供下载)
2,026 阅读
4
精明鼠多功能寻线王 NF-802 拆解
1,551 阅读
5
我想出去浪(多图杀猫,39张)
1,432 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
园博园
AI
锦绣园
台湾
大梅沙
沙井
博物馆
开源
一个公园
猫
文和友
大沙河
荔枝公园
万景楼
华强北
胶片
相机
自动
深圳博物馆
OCR
傻木摄影
累计撰写
394
篇文章
累计收到
50
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
16
篇与
AI
的结果
2024-08-25
腾讯开源GFPGAN图片无损放大,一键懒人包
腾讯开源GFPGAN,一键懒人包 集显不用下载了 A卡也不用下载了 依赖CUDA生态 3年前的老项目了 网上应该是有其他人做的懒人包的 我懒得找 看见模型更新到1.4了 重新打包了下 老样子,删除了一切不我想看见的 尽可能精简体积且不影响输出效果 这个项目对显卡要求较低,大概4gb黄皮显卡都可以流畅运行 1080像素放大4倍,不过消耗约2gb显存 我有尝试将4000万像素放大2倍,显存消耗11.2gb,最终显示内存不足而失败 又选择了4500x3000分辨率图片放大2倍,显存占用4.2gb 选择了6600*4400像素的照片,约2500万像素的,消耗显存9gb,内存约18gb,需要分解204块 这已超出软件使用范畴 软件是用来你修复老旧照片的,意味着低分辨率低像素效果才明显 总体来说,十分优秀 ![效果1.jpg](/usr/uploads/2024/08/3675327155.jpg) ![效果2.jpg](/usr/uploads/2024/08/3896103692.jpg) ![目录结构.jpg](/usr/uploads/2024/08/2845068719.jpg) inp 将待放大图片放在这个文件夹 out 是完成放大图片输出文件夹,放大完成后会自动打开 gfpgan 是程序文件夹,不用管 将图片放在inp文件夹,即可批量处理 图片名不能有中文空格等 解压后,双击 无损放大.bat 按键盘上的2或者4,然后按回车 ![运行截图.jpg](/usr/uploads/2024/08/4041905907.jpg) 超分放大不挑图片类型,风景人文都可以 极端情况是没什么用的 例如,你拿育儿园大合影来超分,那不现实 模型里面数据大多是老外,绿豆大小的人头超分后大多变成老外了 如果有识别到人脸,则会生成对比图,如果没识别出来,则不会有 如果拿大合影来超分,最后一步会对人脸进行切片对比,这一步会消耗较多时间 注意事项,此项目是以人脸优先的,意思是,一张图片,优先识别人脸,背景什么的,大概率不会动,或者是效果不怎么好 如果修复没有人脸信息的风景照,可能没什么效果 负优化,傻木摄影 http://www.gpcb.net/ 项目地址 [https://github.com/TencentARC/GFPGAN](https://github.com/TencentARC/GFPGAN) 更新,显著减小了体积 链接: [https://pan.baidu.com/s/1cTLyNDBIL55SFIkYOLwytQ?pwd=gpcb](https://pan.baidu.com/s/1cTLyNDBIL55SFIkYOLwytQ?pwd=gpcb) [https://www.123pan.com/s/fp3Njv-zcwld.html](https://www.123pan.com/s/fp3Njv-zcwld.html) 提取码:gpcb
2024年08月25日
150 阅读
0 评论
2 点赞
2024-08-10
PhotoMaker_V2:人像面部可控高保真迁移,离线懒人包
PhotoMaker V2: 人像面部可控高保真迁移 开源的,项目地址 [https://github.com/TencentARC/PhotoMaker](https://github.com/TencentARC/PhotoMaker) 由 jian27打包制作[https://www.jian27.com/html/2055.html](https://www.jian27.com/html/2055.html) 本站负优化,汉化,布局调整等,独家发布 姊妹版 [PuLID](https://gpcb.net/3686.html) 效果的话,我认为两个软件半斤八两,我更喜欢 PhotoMaker_V2 本项目最低显卡要求12gb显存,4060 8gb显存出图分辨率1024大约需要5分钟一张图,但是4060 16gb只要20秒一张图 又及:降低采样步数到20,可以降低显存占用,加快出图速度 PhotoMaker是一个由腾讯ARC实验室和南开大学MCG-NKU联合开发的前沿图像生成工具,该项目在CVPR 2024会议上进行了展示。PhotoMaker旨在通过堆叠的ID嵌入技术,实现对真实人类照片的定制化编辑与生成。其核心功能在于能够迅速根据用户提供的参考图像(ID图像),结合文本提示,生成具有高度身份一致性(ID fidelity)且风格多样的照片。 PhotoMaker具有多项关键特性:首先,它支持在几秒内完成快速定制化,无需额外的LoRA训练,极大提升了用户体验; 随着版本的更新,PhotoMaker V2在保持高质量生成和编辑能力的同时,进一步提升了ID一致性。 下图是原始参考图,由AI生成 ![样图.jpg](/usr/uploads/2024/08/1260411825.jpg) 下图是根据参考图生成的 ![生成.jpg](/usr/uploads/2024/08/2496724408.jpg) 下图是根据参考图生成的 ![生成2.jpg](/usr/uploads/2024/08/2934707223.jpg) 下图是根据参考图生成的 ![生成4.jpg](/usr/uploads/2024/08/972361955.jpg) 下图是根据参考图生成的 ![生成3.jpg](/usr/uploads/2024/08/3769746534.jpg) 运行截图,参考图可以上传多张,一般三五张就非常好了 ![运行截图.jpg](/usr/uploads/2024/08/168712229.jpg) 首次运行,之后不需要运行.bat 这个批处理只运行一次即可,重装系统之后才需要再次运行 ![目录结构.jpg](/usr/uploads/2024/08/1300426020.jpg) 小改款 优化了目录结构 设置了输出文件夹,出图后自动保存到out文件夹 图片格式由webp格式改为png 默认采样步骤由30步更改为20步 初始化批处理剪切命令改成了复制 再次小改,将引导比例与采样步数位置互换 将引导比例预设值由5更改为3.2 该数值越大,生成的图像越像硅胶娃娃 越小,对比度不够,反差很低 经反复测试,3.2是个比较折中的值 采样步数原始为50,实测改成20我看不出有什么区别,显卡的好的,可以改成30 增加了高级时装预设 ![预设值.jpg](/usr/uploads/2024/08/2666957598.jpg) 链接: [https://pan.baidu.com/s/1I6V2_g8G086QiZOuMIm_7Q?pwd=gpcb ](https://pan.baidu.com/s/1I6V2_g8G086QiZOuMIm_7Q?pwd=gpcb )
2024年08月10日
174 阅读
0 评论
0 点赞
2024-07-30
AI表情同步(表情迁移),含懒人包
利用AI模型重建静态图片,使其同步目标视频中的表情(表情迁移) 用人话说:上传一个人像图片,再上传一个你想复制表情的参考短视频(几秒钟) 点击重建表情按钮 就会把静态图片转换成视频,表情与你上传的参考视频一致的,音频也是复制参考视频的 开源软件,软件主页如下: [https://github.com/KwaiVGI/LivePortrait](https://github.com/KwaiVGI/LivePortrait) 该软件需要使用老黄家的显卡,显存占用约3gb,4060显卡执行转换7秒钟视频,消耗大约35秒 已重新打包,将官方示例视频图片全部删除了 精简了代码,并且做了汉化 表情迁移使用说明 这个软件太简单了,而且做了汉化 1 上传图片 2 上传参考视频 3 点击 开始同步表情 然后等他完成即可,所有设置全部默认即最佳设置 注意,目标图片和参考视频全部需要用正面,正脸,不然效果不好 面部表情重建使用说明 这个更简单了 1 上传图片 2 调整参数(例如向左偏头,眼睛调整大些,张嘴等等) 3 执行重建 几秒钟即可看见效果 该版本已拆分,表情迁移和表情重塑拆分成两个程序了 为什么拆分?我只用表情重塑,不想看见表情迁移 我喜欢简洁的界面 所有功能都做测试了,没有问题 如果报错,请检查你自己是否有问题 软件不要放在有空格的文件夹,不要放在中文文件夹 载入的图片视频文件名不能有中文,不能有空格 只说这一次 链接: [https://pan.baidu.com/s/19orN6bPtPkRU4AHHMEzKYg?pwd=gpcb ](https://pan.baidu.com/s/19orN6bPtPkRU4AHHMEzKYg?pwd=gpcb ) ![运行界面.jpg](/usr/uploads/2024/07/4246483576.jpg) 该图是AI生成的 ![目标图片.jpg](/usr/uploads/2024/07/1923241234.jpg) [影音片段: 请查看原文播放] [影音片段: 请查看原文播放] 完整界面 ![运行界面.jpg](/usr/uploads/2024/07/2892022854.jpg) 底下的面部重建也是极好玩的 ![面部重建.jpg](/usr/uploads/2024/07/1813470015.jpg)
2024年07月30日
136 阅读
1 评论
1 点赞
2024-04-24
目前生成式AI最大的短板是什么?
目前生成式AI最大的短板是什么? ![1.jpg](/usr/uploads/2024/03/2329140978.jpg) 如图 最大的短板应该是默契 你不懂我 就算放一本百科全书加一本康熙字典在你面前你一样看不懂我 如果有默契 一个眼神就足以说明一切 例如下表格式,一个问卷调查,共8题,每题有多个备选项,至少需要选择3项 ![2.jpg](/usr/uploads/2024/03/875829582.jpg) 我需要做出统计,如下表,某一题中的各个问题被选择了多少次 ![3.jpg](/usr/uploads/2024/03/4218007221.jpg) 对此,我将Excel表单基础数据整理好了,并且写了一份我的需求,如下: 第一页回收,是问卷结果集8列(共8个问题) 第二页统计表单的8个问题和对应的可选项,以及统计列,对应的是第一页的问卷结果集 我需要分析第二页的每一个答案,在第一页中的被选择了多少次 问卷一共收回了152份第7题为例, 选中关爱会主席的2个, 选择关爱委员会成员26个, 选择活动小组团长的6个, 选择活动小组政委的12个, 以上角色均不参加的106个 合计152个 我需要在第2页的统计表单做出统计, 意思是每一题中的每一个问题, 例如 M列的打造ABP文化建设和N列的计数, 每个问题在第一页中被选中了多少次。 数据清洗:将第一页的回收数据(152份问卷)与第二页的题目及可选答案进行对比,确保数据的一致性和准确性以第7题为例。 数据拆分:根据第二页的题目,将第一页的每个问题的答案拆分成对应的可选答案。 例如,如果第二页的第7题有四个可选答案(关爱会主席、关爱委员会成员、活动小组团长、活动小组政委),我们需要将第一页的相应答案拆分成这四个部分。 数据匹配:将拆分后的答案与第二页的可选答案进行匹配,统计每个可选答案在第一页中被选中的次数。 以第7题为例,我们需要执行以下操作: 确认第一页中第7题的答案分布情况。 将答案拆分成四个部分:关爱会主席、关爱委员会成员、活动小组团长、活动小组政委。 对于每个部分,统计在第一页中被选中的次数。例如,关爱会主席被选中2次,关爱委员会成员被选中26次,等等。 在第2页的统计表单中, A列是问题,b列是对A列的统计 同样,C列问题,D列是对C列的统计.... 对于每个可选答案,统计其在第一页中被选中的次数。 重复以上步骤,为第二页的每个题目创建统计表单。 先是问了智谱轻言 各种回复乱七八糟 百度则摆烂,直接不支持excel 月之暗面更简单了,直接罢工
2024年04月24日
39 阅读
0 评论
0 点赞
2024-04-16
怎样破解AI文章一眼假的问题?
![AI.jpg](/usr/uploads/2024/04/1279870162.jpg) 如今感觉越来越离不开AI了 不管是代码类 还是工作总结类 都可以问AI 只要你问问题的足够精确 AI几乎没有废话 比他妈的某度简洁多了 你要什么给你什么 不像某度 要命 普通人用AI主要是做一些文案类的应用 例如工作总结之类的 还有写新闻通稿之类的 都离不开AI 但是有没有发现一个问题 不管你用的是老美顶尖的GPT 还是国内号称比GPT更牛逼的AI 输出的文章一眼即可辨别这不是人写的 这是为什么? 究其原因 我认为这是目前AI最大的痛点 没有人类的情感 所谓的情感 当然由最基本的喜怒哀乐组成的 例如本文开头的那几句 他妈的 除非你给AI特定的身份标签 否则AI绝对不会输出这几个字 这就是典型的情感 还有一点 AI输出的几乎不会有错别字 《康熙字典》共收录汉字47035个 1915年中华书局出版的《中华大字典》共收字48000余个 1986年到1990年的《汉语大字典》收字54678个 1994年出版的《中华辞海》,共收汉字87019个,其中重复字320个 字数最多的要数日本《今昔文字镜》,收录汉字超15万 GB 2312标准共收录6763个汉字,已经覆盖我们99.75%的使用频率 据统计,1000个常用字能覆盖约92%的书面资料 2000字可覆盖98%以上 3000字就已到99%了 综上所述,就算一共有15万字,加上这些字组的词,组的句子 算100万字 典型的AI包含了多少信息呢? 最简单的模型3B 即30亿 这是能加载到手机上的模型 电脑上使用的离线模型一般使用7B或以上 一般来说,小于7B的不建议使用 智商有限,本文不做展开讨论 一个简单的30亿参数的模型几乎包括了人类最常用的所有信息 更别说简单的文字了 AI写文章几乎不会出现任何错别字 为什么不是100%呢? 毕竟模型是人类训练的 只要有人类参与 不可能达到100% 想必这就是硅基生命为何要取代碳基生命的理由之一吧 又扯远了 回头再来说 AI生成的文章是生成式的 具有随机性 专业名词叫做随机种子 但是万变不离其宗 人类训练AI模型时 是按照人类最常见的 最简单的 大众所熟知的 教科书式的 例如代码规范 100%按照官方规范投喂的 例如生成式文章 都是拿名人名作去投喂的 所以你跟AI说 请模仿鲁迅的文笔给你写一篇文章 那真是毫不费力分分钟就好 正因为AI的守规矩 所以就有了方圆 这里的方圆就是一个圈圈 只要是AI写的文章 都出不了圈 一眼就可以识别这是AI写的 例如人类会经常说些倒装句 这是AI写的吧,这篇作文 这是AI写的吧,这篇论文 这是AI写的吧,这首歌词 你吃了吧,中饭 你交了没有?学费 看了小视屏里面教程,一边看一边做,我真是学废了 我左手一只鸡,右手一只鸭,嘴里喝着8瓶娃娃 是不是就没有AI色彩了 而是感受到了人类的色彩 所以 AI写的文章 你得再改改 改个倒装句 故意写错几个字 同音不同义的 等等等等 可以比较快速的抹除部分AI痕迹 到底能抹除几分,那要看你用心几分了
2024年04月16日
52 阅读
0 评论
0 点赞
2024-04-15
AI离线抠图_一键傻瓜批量抠图
AI离线抠图_一键傻瓜批量抠图 AI,已经不知不觉深入到生活工作的方方面面了 从高大上的新闻中,走入寻常百姓家中 从高大上的中心机房,走入寻常寻常家用电脑 从顶尖玩家手中的玩物,变成大众唾手可得的工具 这不,原包1.6gb的,精简到300mb 只带一个常用的模型 可以一键批量抠图 虽然还做不到发丝级别 寻常的简单抠图还是可以的 为了解压效率,并没有做极限压缩 极限压缩还能小20mb,但是解压就会稍慢几秒钟了 ![解压.jpg](/usr/uploads/2024/04/4039315241.jpg) 正确的做法是,在d盘新建一个in文件夹,将图片复制到这个文件夹,再运行程序 当然了,你可以直接运行这个程序,会自动新建文件夹,自动打开这个文件夹 你再将图片复制进去,一样可以完成抠图,如果你复制了多张,只扣了一张,重新运行程序即可 ![执行结果.jpg](/usr/uploads/2024/04/2570643545.jpg) 下载地址 [https://www.123pan.com/s/fp3Njv-yJMld.html](https://www.123pan.com/s/fp3Njv-yJMld.html) 提取码:gpcb
2024年04月15日
78 阅读
0 评论
0 点赞
2024-03-20
AI时代的信息,真假难辨
AI对设计行业冲击非常大 一朋友做沃尔玛广告牌设计工作的 刚刚听说开始裁员了 在AI之前,大伙的照骗还得靠PS ps玩的溜的,p出的图真假难辨 但是周围没几个玩的好的 门框实在太高 现在AI出来了 完全不一样了 哪怕没有任何基础 只要你会打字 中文即可 后台会给你自动翻译成英文 然后进行文生图 哪怕在原生图上做任何修改 都是非常简单容易的事情 下图是某天下班时,拍的一张日落 其实手机变焦放大拍的,出图时手机已经使用了一轮AI计算 ![1.jpg](/usr/uploads/2024/03/201096593.jpg) 这是使用PS后期强拉对比后的 ![2.jpg](/usr/uploads/2024/03/1085921192.jpg) 由ai贴飞机,然后再次拉对比的 ![3.jpg](/usr/uploads/2024/03/630530754.jpg)
2024年03月20日
44 阅读
0 评论
0 点赞
1
2
3
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net