| Contact Us | CHT | Mobile | Wechat | Weibo | Search:
Welcome Visitors | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

Home

News

Forums

Realty

大温餐馆点评

Car

Education

Yellow Page

Travel

谷歌: Google重磅更新,仿佛看到了AGI的影子

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
Gemini是个水桶型模型,可能在数学,推理,创意上都比不上最好的模型。但是它每一项的能力都不差,甚至多模态理解处于全球领先行列,速度也是嘎嘎快。


刚刚,Google宣布在Google AI Studio和Gemini API上开放Gemini 2.0 Flash的原生图像生成功能,供开发者测试和实验。也就是不止输入可以图文,现在模型可以无缝的融合图文同时输出了!

不仅能理解文字,还能直接根据描述生成令人惊艳的高质量图片。主要功能包括:文本+图像生成、对话式图像编辑、真实感图片创作以及高质量文本渲染。


它不仅能理解文字,还能直接根据描述生成高质量的图片。支持 文本+图像生成、对话式图像编辑、真实感图片创作、高质量文本渲染。

多模态能力:可以同时理解文字、图像,并在二者之间建立联系。

智能推理:能够结合现实世界的知识,生成准确的视觉内容。

自然语言交互:支持用户通过对话方式调整修改图片,类似 AI 画师助手。

接下来是试玩环节~

输入一个描述:“以“一只可爱的猪在天上飞”为主题,生成6副连续插画。”

Gemini 2.0 Flash会根据文本生成一系列插图,让角色和场景在不同画面中保持一致性。从结果可以看到,它能在一次内容输出中包含多张图,且角色形象始终如一。




进一步,还可以要求它修改绘画风格(如卡通风、写实风等)。

这样想象空间就很大了,如之前很多爆款的针对小孩的插画故事视频,古诗插画视频,门槛制作进一步降低了。


除此之外,我们还可以,用语言完成PS,并且这是有多轮交互支持上下文的!

在举个例子: “让AI生成一个蓝色的房子”,然后进行交互修改布局,颜色:



相比一般的AI画图工具,Gemini 2.0 Flash能理解更多现实世界的细节和文化背景。

因为Gemini本身是经过了大量语言模型训练的,所以世界知识丰富,利用世界知识和增强推理来创建正确的图像。这使得它非常适合创建逼真的详细图像——比如“我想做一道东北大乱炖,请告诉我要怎么做,每一步骤请配上图片”。


觉得新闻不错,请点个赞吧     好新闻没人评论怎么行,我来说几句
Prev Page12Next Page
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
    _RELATED_NEWS:
    _RELATED_NEWS_MORE:
    _POSTMYCOMMENT:
    Comment:
    Security Code:
    Please input the number which is shown on the following picture
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    Page Generation: 0.0500 Seconds and 2 DB Queries in 0.0013 Seconds