• 欢迎访问佰阅部落
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

小白兔AI:面向非编程人员的AI人工智能工具箱

人工智能 佰阅 1年前 (2022-08-30) 4109次浏览

随着 AI 人工智能、机器学习技术的不断发展,各种 AI 算法的应用也越来越广泛!不过这些黑科技大多数需要编程基础,于是我们从头设计了一些列可视化GUI操作界面,自研了支持Inter、Nvidia和Amd显卡的AI聚合引擎,支持OCR识别、录音降噪、动漫超分辨、视频抠图、视频补帧等等,软件体积小巧、UI现代化、操作极简又高效,值得推荐。

0. 创作背景

2021年下半年个人开启了反内耗多输出模式,在10月国庆期间,突破了基于Wails编写GUI的技术,于是在全栈开发者背景下,自然是计划写出一些东西来,恰巧人工智能方向就是我非常感兴趣的方向。然而常规Paper论文都是基于Pytorch的python代码,打包成GUI一般软件体积巨大,速度也很慢,正好此时腾讯开源的ncnn非常契合我的需求,只需写一次代码就可以跨终端部署,意义非凡。当核心技术突破后,剩下的就特别简单了,于是我开源的Paper2GUI一口气量产了18个可视化界面,极大的方便了非编程人员使用。

2022年6月份,随着本系列APP增多,粉丝提议搞一个聚合APP,于是小白兔AI 在8月正式诞生。为了做的更好、更专业,采取付费订阅模式,定价亲民,欢迎尝鲜。

1. 软件通用优势

  • 底层自研AI引擎,C++编写,性能优势明显
  • GPU加速推理,Inter、Nvidia、Amd全支持
  • 可视化界面,操作简单,一键推理
  • 聚合AI,实用为主、生产力为主

2. 动漫超分辨功能

支持图片或视频超分辨放大,同时不丢失细节,画质改善明显。此类工具常被用来B站二次元超清2K或4K视频创作。

动漫图片超分辨领域,RealCugan-Pro模型质量最佳,其次是ReslESRGAN,这两者质量都比waifu2x好太多。小白兔AI 已内置RealCugan-Pro和ReslESRGAN两种超分辨模型,支持图片或视频超分辨放大,全都一键处理。

3. 录音降噪功能

目前已支持录音文件或视频文件的声音降噪,AI一键降噪,速度快,质量高。假如你的视频录音含有电流、机械、环境噪音等,可获得显著的降噪效果,无需千元级专业麦克风就能获得清晰优质的人声。

4. 视频补帧

视频插帧算法Rife和Ifrnet,可以提升帧率,观感体验变得丝滑。特别适合运动类场景或镜头快速变化的场景,普通静态或运动幅度不大的场景,人眼感觉不到。

软件支持自定义调整并发数,可根据显卡体质自行调整,从而最大程度适配不同的显卡。一般期望是GPU利用率满载,同时不爆显存即可。

5. OCR 图片批量识别

此类场景用途广泛,我们完成了Paddler-OCR-v3模型的本地化运行,操作简单,支持单张或多张图片批量处理。模型识别度高、准确率优秀,让你不再远程调用各种API,延时低至约几ms,支持中英文,甚至可识别繁体字。

该功能可拓展性强,未来还将上线字幕提取、图片文字替换等功能。

6. 视频抠图功能

图片抠图算法基本成熟,不再过多介绍,视频抠图一键生成绿幕视频,方便二次创作。此类技术可以非常方便的完成视频人像抠图,不再需要专业绿幕背景,只需要你的视频人物居中即可。

7. 语音合成功能

包含文字转语音工具,适用于自媒体视频配音、讲解、读书、广告等场景。语音合成一直以来是语言、语音、深度学习及人工智能等领域的热门研究方向,现在已发展有多种情绪、呼吸停顿等效果非常接近真人!小白兔AI 已集成了来自微软、火山的语音合成引擎。

8. 人脸生成动漫照片

这是一个非常有意思的功能,可以将人物头像高质量的转换为动漫化风格的图片,该图片还可以进行二次超分辨放大,效果震撼,广受好评。

后续计划

继续拓展基础AI新功能,尝试突破动作捕捉、语音识别、字幕提取、deepfake、照片修复、智能涂抹、二次元生成、艺术创作disco diffusion等。虽然技术角度上我们会越来越丰富、越实用,但我们还需要更多的反馈,尤其是实际工作流上的一些具体问题。欢迎在软件内置的反馈渠道里告诉我们你的需求及想法,一起助力人工智能更加普及化、实用化。

下载地址

官网:xiaobaituai.com

开源:Paper2Gui


佰阅部落 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:小白兔AI:面向非编程人员的AI人工智能工具箱
喜欢 (8)