既然大家对看图说话那么有兴趣。有的人想找还找不到。我把叫做西瓜的朋友发了这个帖子。重新再发一遍。希望西瓜朋友谅解,这也是为大家好。

其实图像描述和看图说话不只是在读屏软件可以进行使用。昨天只是个游客发了个论坛说。在 AI模型里面的看图说话都可以使用。所以大家平常不要那么死板。我也能理解大家的心情。看图说话崩溃了,一时之间没有那么快的时间能找到新的接口来代替。所以目前市面上的人工模型一大把。其中他用了讯飞心火。来给大家进行演示注册。这个讯飞心火。对于我来说。目前放在其他市面上的那个模型接口这个才算挺好用的啦。那么今天我给大家演示一下讯飞星火的这个看图说话它的效果怎么样?首先我在手机的本地相册里选取了我们平常存下来的这些照片进行识别。点击表情。点击一张照片。点击确认按钮。这个时候它显示正在生成中。过了五六秒钟。生成的结果出来了。来看看他的描述结果吧。收到您的图片啦~以下是关于该图片的描述:


这张图片展示了一个白色的盒子,上面有一个黑色的标志。盒子上有一个按钮和一个插孔,插孔位于盒子的左侧。盒子上还写着"oodi 无笛电吹管",这可能是产品名称或品牌名称。好的,我知道这个盒子是什么东东呢,原来是我平常保存下来的无敌电吹管的照片。那么中间有输入框可以告诉他。请问能否详细描述一下这个盒子的主要内容呢?过了一会儿他又回复我了。这个盒子是一个无笛电吹管,具有高品质音色和大音量外放。它可以通过蓝牙或USB MIDI连接到计算机、平板电脑或智能手机上。这款初学者友好的设备非常适合音乐爱好者和专业演奏家。此外,用户可以享受免费升级音色和功能的优惠。哈哈哈。看来心火的这个看图说话,他描述的挺详细的。多亏那个图片上面有文字。他才知道是什么品牌的无敌电吹管。接下来选取第2张照片。点击确认。过了五六秒钟。这张图片展示了一个木管、民族、铜管和电子音乐的组合。木管包括笛子、手风琴、长笛、小号、圆号、低音萨克斯、长号、铜管合奏、箫、短笛、高音萨克斯、口琴、单簧管和中音萨克斯。电子乐器包括打击乐、弦乐和合成器。打击乐包括小提琴,弦乐包括钟声、太空双簧管和大提琴,而合成器包括合成主音1、合成低音1、合成主音2和合成低音2。这个应该是关于无敌电吹管的那些主要配件吧。也描述的挺详细的。继续点击。来看看第3张。收到您的图片啦~以下是关于该图片的描述:


图中展示的是一款手机,它的屏幕是黑色的,手机上有一些按键,这些按键分布在手机的上方,手机放在一个白色的盒子上。对对对。这个是点名尊享30的图片。接下来哦,我在我的房间拍几张照片让他识别一下,描述一下我房间里面的商品。首先我对准空调咔擦拍了一张。点击讯飞星火。点击上传。过了一会儿。收到您的图片啦~以下是关于该图片的描述:


图片中有一个白色的空调,上面有几个按钮。其中一个按钮是红色的,另一个是绿色的。空调上还有两个数字显示屏,一个显示制冷量,另一个显示输入功率。描述的也挺正确的。中间有一个输入框,我想知道这个空调的详细描述。请问这款空调的品牌名字叫什么?它是挂在墙上的还是放在地上的?点击发送。过了一会儿。从图中可以看到空调的左上角有"格力"字样,所以可以知道这个空调是格力的。它是放在地板上的。厉害厉害。我怎么总感觉比那个点名软件的那个看图说话好像好了一点呢。接着我就对着自己的窗户那两个水瓶拍一张试一下。点击上传。过了一会儿。收到您的图片啦~以下是关于该图片的描述:


这张图像中有两个水瓶,一个是红色的,另一个是蓝色的,它们放在窗台上。窗台是由白色玻璃制成的,窗户外面有一片模糊的景色。挺厉害的。所以现在大家知道,现在点名这边暂时没有看图说话之后大家该怎么运用,人家模型的那个看图说话了吧。不过温馨提醒一下大家。如果让图片描述得详细一点,最好是要在那个光线好一些的地方。如果你拍出来的那种效果是模糊一点的,很容易描述错的。所以大家平常要注意自己周围的光线。不过唯一有点缺陷的是,目前很多人工模型他们做的那些无障碍特别的不理想。譬如这个文心一严吧。说句不好听点的点进去差不多,所有的功能都是读按钮按钮,甚至未加标签。连那个历史记录都很难找。然后再来说说这个讯飞新伙。除了那个个人中心。对话功能。发现。社区。勉强能使用之外。那么其他的无障碍,我估计要有盲人朋友反馈给信息无障碍那边进行。提交建议。给官方那边进行优化了。那么最后。据我了解国外的那款Be My Eyes志愿者软件。也接入了check4.0接口。做成了我们的好帮手,虚拟志愿者。我们可以通过它的功能进行周围环境图像描述。唯一遗憾的是,目前只限苹果用户,正在内测阶段。后续的什么安卓开放,就等待后期的消息吧。好了,关于这个看图说话就给大家啰嗦到这里了。

发表于:2023-09-17 17:17
6个回复
您还没有登录,登录后才可回复。 登录 注册