Gradio 月活用户突破 100 万!

阅读更多
Gradio logo
  1. 组件
  2. Image

Gradio 新手?从这里开始: 入门指南

查看发布历史

Image

gradio.Image(···)
import gradio as gr with gr.Blocks() as demo: gr.Image() demo.launch()

描述

创建图像组件,可用于上传图像(作为输入)或显示图像(作为输出)。

行为

作为输入组件: 根据 type,将上传的图像作为 numpy.arrayPIL.Imagestr 文件路径传递。

您的函数应接受以下类型之一
def predict(
	value: np.ndarray | PIL.Image.Image | str | None
)
	...

作为输出组件: 期望 numpy.arrayPIL.Imagestrpathlib.Path 图像文件路径以显示图像。

您的函数应返回以下类型之一
def predict(···) -> np.ndarray | PIL.Image.Image | str | Path | None
	...	
	return value

初始化

参数
🔗
value: str | PIL.Image.Image | np.ndarray | Callable | None
default = None

Image 组件将要采用的默认值的 PIL 图像、numpy 数组、路径或 URL。如果提供了函数,则每次应用加载时都会调用该函数以设置此组件的初始值。

🔗
format: str
default = "webp"

文件格式(例如“png”或“gif”)。用于保存图像(如果它尚不具有有效格式)(例如,如果图像作为 numpy 数组或 PIL 图像返回到前端)。该格式应受 PIL 库支持。当此组件用作输入或输出时均适用。此参数对 SVG 文件无效。

🔗
height: int | str | None
default = None

组件的高度,如果传递数字,则以像素为单位指定,如果传递字符串,则以 CSS 单位指定。这对预处理的图像文件或 numpy 数组没有影响,但会影响显示的图像。

🔗
width: int | str | None
default = None

组件的宽度,如果传递数字,则以像素为单位指定,如果传递字符串,则以 CSS 单位指定。这对预处理的图像文件或 numpy 数组没有影响,但会影响显示的图像。

🔗
image_mode: Literal['1', 'L', 'P', 'RGB', 'RGBA', 'CMYK', 'YCbCr', 'LAB', 'HSV', 'I', 'F'] | None
default = "RGB"

图像应加载和预处理的像素格式和颜色深度。“RGB”会将图像加载为彩色图像,或“L”加载为黑白图像。有关其他受支持的图像模式及其含义,请参阅 https://pillow.pythonlang.cn/en/stable/handbook/concepts.html。此参数对 SVG 或 GIF 文件无效。如果设置为 None,则将从图像文件类型推断 image_mode(例如,.png 图像为“RGBA”,大多数其他情况下为“RGB”)。

🔗
sources: list[Literal['upload', 'webcam', 'clipboard']] | Literal['upload', 'webcam', 'clipboard'] | None
default = None

图像的源列表。“upload”创建一个用户可以放置图像文件的框,“webcam”允许用户从其网络摄像头拍摄快照,“clipboard”允许用户从剪贴板粘贴图像。如果为 None,则当 streaming 为 False 时,默认为 ["upload", "webcam", "clipboard"],否则默认为 ["webcam"]。

🔗
type: Literal['numpy', 'pil', 'filepath']
default = "numpy"

图像在传递到预测函数之前转换的格式。“numpy”将图像转换为形状为 (height, width, 3) 且值从 0 到 255 的 numpy 数组,“pil”将图像转换为 PIL 图像对象,“filepath”传递包含图像的临时文件的 str 路径。为了支持输入中的动画 GIF,`type` 应设置为“filepath”或“pil”。为了支持 SVG,`type` 应设置为“filepath”。

🔗
label: str | None
default = None

此组件的标签。显示在组件上方,如果此组件有示例表,则也用作标题。如果为 None 并且在 `gr.Interface` 中使用,则标签将是分配给此组件的参数名称。

🔗
every: Timer | float | None
default = None

如果 `value` 是函数,则持续调用 `value` 以重新计算它(否则无效)。可以提供一个 Timer,其刻度重置 `value`,或者提供一个浮点数,该浮点数提供重置 Timer 的常规间隔。

🔗
inputs: Component | list[Component] | set[Component] | None
default = None

如果 `value` 是函数,则用作计算 `value` 的输入的组件(否则无效)。每当输入更改时,`value` 都会重新计算。

🔗
show_label: bool | None
default = None

如果为 True,将显示标签。

🔗
show_download_button: bool
default = True

如果为 True,将显示下载图像的按钮。仅当 interactive 为 False 时适用(例如,如果组件用作输出)。

🔗
container: bool
default = True

如果为 True,则将组件放置在容器中 - 在边框周围提供一些额外的填充。

🔗
scale: int | None
default = None

与相邻组件相比的相对大小。例如,如果组件 A 和 B 位于 Row 中,并且 A 的 scale=2,而 B 的 scale=1,则 A 的宽度将是 B 的两倍。应为整数。scale 应用于 Rows,以及 Blocks 中 fill_height=True 的顶级组件。

🔗
min_width: int
default = 160

最小像素宽度,如果屏幕空间不足以满足此值,则将换行。如果某个比例值导致此组件比 min_width 更窄,则将首先考虑 min_width 参数。

🔗
interactive: bool | None
default = None

如果为 True,则允许用户上传和编辑图像;如果为 False,则只能用于显示图像。如果未提供,则根据组件是用作输入还是输出进行推断。

🔗
visible: bool
default = True

如果为 False,组件将被隐藏。

🔗
streaming: bool
default = False

如果在 `live` 界面中使用时为 True,将自动流式传输网络摄像头馈送。仅当源为“webcam”时有效。如果组件是输出组件,将自动将图像转换为 base64。

🔗
elem_id: str | None
default = None

一个可选字符串,在 HTML DOM 中分配为此组件的 id。可用于定位 CSS 样式。

🔗
elem_classes: list[str] | str | None
default = None

一个可选的字符串列表,在 HTML DOM 中分配为此组件的类。可用于定位 CSS 样式。

🔗
render: bool
default = True

如果为 False,组件将不会在 Blocks 上下文中呈现。如果目的是现在分配事件侦听器,但稍后呈现组件,则应使用此选项。

🔗
key: int | str | None
default = None

如果已分配,将用于在重新渲染中假定身份。在重新渲染中具有相同键的组件将保留其值。

🔗
mirror_webcam: bool
default = True

如果为 True,网络摄像头将镜像。默认为 True。

🔗
show_share_button: bool | None
default = None

如果为 True,将在组件的角落显示一个共享图标,允许用户将输出共享到 Hugging Face Spaces Discussions。如果为 False,则不会显示图标。如果设置为 None(默认行为),则当此 Gradio 应用在 Spaces 上启动时,图标会显示,否则不会显示。

🔗
placeholder: str | None
default = None

上传区域的自定义文本。覆盖提供的默认上传消息。接受换行符和 `#` 以指定标题。

🔗
show_fullscreen_button: bool
default = True

如果为 True,将在组件的角落显示一个全屏图标,允许用户以全屏模式查看图像。如果为 False,则不会显示图标。

🔗
webcam_constraints: dict[str, Any] | None
default = None

一个字典,允许开发人员为网络摄像头流指定自定义媒体约束。此参数提供了控制视频流属性的灵活性,例如分辨率和移动设备上的前置或后置摄像头。请参阅 demo/webcam_constraints

快捷方式

Interface 字符串快捷方式 初始化

gradio.Image

“image”

使用默认值

GIFSVG 图像格式

gr.Image 组件可以处理或显示 PIL 库支持的任何图像格式,包括动画 GIF。此外,它还支持 SVG 图像格式。

gr.Image 组件用作输入组件时,图像将根据 type 参数转换为 str 文件路径、PIL.Image 对象或 numpy.array。但是,动画 GIF 和 SVG 图像的处理方式有所不同

  • 动画 GIF 图像只能转换为 str 文件路径或 PIL.Image 对象。如果将它们转换为 numpy.array(这是默认行为),则只会使用第一帧。因此,如果您的演示需要输入 GIF 图像,请确保相应地设置 type 参数,例如:
import gradio as gr

demo = gr.Interface(
    fn=lambda x:x, 
    inputs=gr.Image(type="filepath"), 
    outputs=gr.Image()
)
    
demo.launch()
  • 对于 SVG 图像,type 参数将被完全忽略,并且图像始终作为图像文件路径返回。这是因为 SVG 图像不能作为 PIL.Imagenumpy.array 对象处理。

演示

import numpy as np
import gradio as gr

def sepia(input_img):
    sepia_filter = np.array([
        [0.393, 0.769, 0.189],
        [0.349, 0.686, 0.168],
        [0.272, 0.534, 0.131]
    ])
    sepia_img = input_img.dot(sepia_filter.T)
    sepia_img /= sepia_img.max()
    return sepia_img

demo = gr.Interface(sepia, gr.Image(), "image")
if __name__ == "__main__":
    demo.launch()

		

事件侦听器

描述

事件侦听器允许您响应用户与您在 Gradio Blocks 应用中定义的 UI 组件的交互。当用户与元素交互时,例如更改滑块值或上传图像,将调用一个函数。

支持的事件侦听器

Image 组件支持以下事件侦听器。每个事件侦听器都采用相同的参数,这些参数在下面的事件参数表中列出。

侦听器 描述

Image.clear(fn, ···)

当用户使用组件的清除按钮清除图像时,将触发此侦听器。

Image.change(fn, ···)

当 Image 的值由于用户输入(例如,用户在文本框中键入内容)或函数更新(例如,图像从事件触发器的输出接收值)而更改时触发。有关仅由用户输入触发的侦听器,请参阅 .input()

Image.stream(fn, ···)

当用户流式传输图像时,将触发此侦听器。

Image.select(fn, ···)

当用户选择或取消选择图像时的事件侦听器。使用事件数据 gradio.SelectData 携带 value(指图像的标签)和 selected(指图像的状态)。有关如何使用此事件数据的详细信息,请参阅 EventData 文档

Image.upload(fn, ···)

当用户将文件上传到图像中时,将触发此侦听器。

Image.input(fn, ···)

当用户更改图像的值时,将触发此侦听器。

事件参数

参数
🔗
fn: Callable | None | Literal['decorator']
default = "decorator"

触发此事件时要调用的函数。通常是机器学习模型的预测函数。函数的每个参数对应一个输入组件,函数应返回单个值或值元组,元组中的每个元素对应一个输出组件。

🔗
inputs: Component | BlockContext | list[Component | BlockContext] | Set[Component | BlockContext] | None
default = None

用作输入的 gradio.components 列表。如果该函数不接受任何输入,则应为空列表。

🔗
outputs: Component | BlockContext | list[Component | BlockContext] | Set[Component | BlockContext] | None
default = None

用作输出的 gradio.components 列表。如果该函数不返回任何输出,则应为空列表。

🔗
api_name: str | None | Literal[False]
default = None

定义端点在 API 文档中的显示方式。可以是字符串、None 或 False。如果设置为字符串,则端点将在 API 文档中公开,并带有给定的名称。如果为 None(默认值),则函数名称将用作 API 端点。如果为 False,则端点不会在 API 文档中公开,并且下游应用(包括 `gr.load` 此应用的应用)将无法使用此事件。

🔗
scroll_to_output: bool
default = False

如果为 True,将在完成后滚动到输出组件

🔗
show_progress: Literal['full', 'minimal', 'hidden']
default = "full"

在事件运行时如何显示进度动画:“full”显示一个覆盖输出组件区域的微调器以及右上角的运行时显示,“minimal”仅显示运行时显示,“hidden”不显示任何进度动画

🔗
show_progress_on: Component | list[Component] | None
default = None

要在其上显示进度动画的组件或组件列表。如果为 None,则将在所有输出组件上显示进度动画。

🔗
queue: bool
default = True

如果为 True,则会将请求放在队列中(如果已启用队列)。如果为 False,即使已启用队列,也不会将此事件放在队列中。如果为 None,将使用 gradio 应用的队列设置。

🔗
batch: bool
default = False

如果为 True,则函数应处理一批输入,这意味着它应接受每个参数的输入值列表。列表的长度应相等(并且最大长度为 `max_batch_size`)。然后*必须*函数返回列表元组(即使只有一个输出组件),元组中的每个列表对应一个输出组件。

🔗
max_batch_size: int
default = 4

如果从队列调用此事件,则要批量处理的最大输入数(仅在 batch=True 时相关)

🔗
preprocess: bool
default = True

如果为 False,则在运行 'fn' 之前不会运行组件数据的预处理(例如,如果使用 `Image` 组件调用此方法,则将其保留为 base64 字符串)。

🔗
postprocess: bool
default = True

如果为 False,则在将 'fn' 输出返回到浏览器之前,不会运行组件数据的后处理。

🔗
cancels: dict[str, Any] | list[dict[str, Any]] | None
default = None

当触发此侦听器时要取消的其他事件的列表。例如,设置 cancels=[click_event] 将取消 click_event,其中 click_event 是另一个组件的 .click 方法的返回值。尚未运行的函数(或正在迭代的生成器)将被取消,但当前正在运行的函数将被允许完成。

🔗
trigger_mode: Literal['once', 'multiple', 'always_last'] | None
default = None

如果为“once”(除 `.change()` 之外的所有事件的默认值),则在事件挂起期间不允许任何提交。如果设置为“multiple”,则在挂起期间允许无限次提交,而“always_last”(`.change()` 和 `.key_up()` 事件的默认值)将在挂起事件完成后允许第二次提交。

🔗
js: str | Literal[True] | None
default = None

在运行“fn”之前要运行的可选前端 js 方法。“js”方法的输入参数是“inputs”和“outputs”的值,返回值应为输出组件的值列表。

🔗
concurrency_limit: int | None | Literal['default']
default = "default"

如果设置,这是可以同时运行的此事件的最大数量。可以设置为 None 以表示没有 concurrency_limit(可以同时运行此事件的任意数量)。设置为“default”以使用默认并发限制(由 `Blocks.queue()` 中的 `default_concurrency_limit` 参数定义,该参数本身默认为 1)。

🔗
concurrency_id: str | None
default = None

如果设置,这是并发组的 id。具有相同 concurrency_id 的事件将受到最低设置 concurrency_limit 的限制。

🔗
show_api: bool
default = True

是否在 Gradio 应用的“查看 API”页面中或在 Gradio 客户端的 “.view_api()” 方法中显示此事件。与将 api_name 设置为 False 不同,将 show_api 设置为 False 仍将允许下游应用以及客户端使用此事件。如果 fn 为 None,则 show_api 将自动设置为 False。

🔗
time_limit: int | None
default = None
🔗
stream_every: float
default = 0.5
🔗
like_user_message: bool
default = False

指南