Gradio Agents & MCP 黑客马拉松
获奖者Gradio Agents & MCP 黑客马拉松
获奖者gradio.MultimodalTextbox(···)
dict
传入函数。def predict(
value: MultimodalValue | None
)
...
dict
,包含可选的 "text" 和 "files"。files 数组是文件路径或 URL 的列表。def predict(···) -> MultimodalValue | None
...
return value
value: str | dict[str, str | list] | Callable | None
= None
在 MultimodalTextbox 中显示的默认值。一个字符串值,或一个形如 {"text": "sample text", "files": [{path: "files/file.jpg", orig_name: "file.jpg", url: "http://image_url.jpg", size: 100}]} 的字典。如果提供函数,则每次应用程序加载时都会调用该函数来设置此组件的初始值。
sources: list[Literal['upload', 'microphone']] | Literal['upload', 'microphone'] | None
= None
允许的来源列表。"upload" 创建一个按钮,用户可以点击或拖放文件上传,"microphone" 创建一个麦克风输入。如果为 None,则默认为 ["upload"]。
file_types: list[str] | None
= None
要上传的文件扩展名或文件类型列表(例如 ['image', '.json', '.mp4'])。"file" 允许上传任何文件,"image" 仅允许上传图像文件,"audio" 仅允许上传音频文件,"video" 仅允许上传视频文件,"text" 仅允许上传文本文件。
file_count: Literal['single', 'multiple', 'directory']
= "single"
如果为 "single",则允许用户上传一个文件。如果为 "multiple",则用户上传多个文件。如果为 "directory",则用户上传选中目录中的所有文件。对于 "multiple" 或 "directory" 的情况,返回类型将是每个文件的列表。
label: str | I18nData | None
= None
此组件的标签,如果 `show_label` 为 `True`,则显示在组件上方,如果此组件有示例表,则也用作标题。如果为 None 且在 `gr.Interface` 中使用,则标签将是此组件对应的参数名称。
every: Timer | float | None
= None
如果 `value` 是一个函数,则持续调用 `value` 以重新计算它(否则无效)。可以提供一个 Timer,其滴答声会重置 `value`,或者一个浮点数,提供重置 Timer 的常规间隔。
inputs: Component | list[Component] | set[Component] | None
= None
如果 `value` 是一个函数,则用作计算 `value` 的输入组件(否则无效)。`value` 会在输入更改时重新计算。
scale: int | None
= None
相对于相邻组件的相对大小。例如,如果组件 A 和 B 在一行中,A 的 scale=2,B 的 scale=1,那么 A 将是 B 的两倍宽。应该是一个整数。scale 适用于行,以及 `Blocks` 中 `fill_height=True` 的顶级组件。
min_width: int
= 160
最小像素宽度,如果屏幕空间不足以满足此值,则会换行。如果某个比例值导致此组件宽度小于 `min_width`,则 `min_width` 参数将被优先遵守。
key: int | str | tuple[int | str, ...] | None
= None
在 `gr.render` 中,跨重新渲染具有相同键的组件被视为同一组件,而不是新组件。在 'preserved_by_key' 中设置的属性不会在重新渲染时重置。
preserved_by_key: list[str] | str | None
= "value"
此组件构造函数中的参数列表。在 `gr.render()` 函数中,如果组件使用相同的键重新渲染,则这些(且仅这些)参数将在 UI 中被保留(如果它们已被用户或事件监听器更改),而不是根据构造函数中提供的值重新渲染。
类 | Interface 字符串快捷方式 | 初始化 |
---|---|---|
| "multimodaltextbox" | 使用默认值 |
import gradio as gr
import time
# Chatbot demo with multimodal input (text, markdown, LaTeX, code blocks, image, audio, & video). Plus shows support for streaming text.
def print_like_dislike(x: gr.LikeData):
print(x.index, x.value, x.liked)
def add_message(history, message):
for x in message["files"]:
history.append({"role": "user", "content": {"path": x}})
if message["text"] is not None:
history.append({"role": "user", "content": message["text"]})
return history, gr.MultimodalTextbox(value=None, interactive=False)
def bot(history: list):
response = "**That's cool!**"
history.append({"role": "assistant", "content": ""})
for character in response:
history[-1]["content"] += character
time.sleep(0.05)
yield history
with gr.Blocks() as demo:
chatbot = gr.Chatbot(elem_id="chatbot", bubble_full_width=False, type="messages")
chat_input = gr.MultimodalTextbox(
interactive=True,
file_count="multiple",
placeholder="Enter message or upload file...",
show_label=False,
sources=["microphone", "upload"],
)
chat_msg = chat_input.submit(
add_message, [chatbot, chat_input], [chatbot, chat_input]
)
bot_msg = chat_msg.then(bot, chatbot, chatbot, api_name="bot_response")
bot_msg.then(lambda: gr.MultimodalTextbox(interactive=True), None, [chat_input])
chatbot.like(print_like_dislike, None, None, like_user_message=True)
if __name__ == "__main__":
demo.launch()
事件监听器允许您响应用户与您在 Gradio Blocks 应用程序中定义的 UI 组件的交互。当用户与元素交互时,例如更改滑块值或上传图像,将调用一个函数。
MultimodalTextbox 组件支持以下事件监听器。每个事件监听器都接受相同的参数,这些参数列在下面的 事件参数 表中。
监听器 | 描述 |
---|---|
| 当 MultimodalTextbox 的值因用户输入(例如用户在文本框中输入)或函数更新(例如图像从事件触发器的输出接收值)而更改时触发。有关仅由用户输入触发的监听器,请参阅 |
| 当用户更改 MultimodalTextbox 的值时,此监听器被触发。 |
| 当用户选择或取消选择 MultimodalTextbox 时触发的事件监听器。使用事件数据 gradio.SelectData 来携带指代 MultimodalTextbox 标签的 |
| 当 MultimodalTextbox 获得焦点时,用户按下回车键时,此监听器被触发。 |
| 当 MultimodalTextbox 获得焦点时,此监听器被触发。 |
| 当 MultimodalTextbox 失去焦点/模糊时,此监听器被触发。 |
| 当用户到达 MultimodalTextbox 中播放媒体的末尾时,此监听器被触发。 |
fn: Callable | None | Literal['decorator']
= "decorator"
此事件触发时调用的函数。通常是机器学习模型的预测函数。函数的每个参数对应一个输入组件,函数应返回单个值或值的元组,其中元组中的每个元素对应一个输出组件。
inputs: Component | BlockContext | list[Component | BlockContext] | Set[Component | BlockContext] | None
= None
用作输入的 gradio.components 列表。如果函数没有输入,则应为空列表。
outputs: Component | BlockContext | list[Component | BlockContext] | Set[Component | BlockContext] | None
= None
用作输出的 gradio.components 列表。如果函数没有返回输出,则应为空列表。
api_name: str | None | Literal[False]
= None
定义端点在 API 文档中如何显示。可以是字符串、None 或 False。如果设置为字符串,则端点将以给定名称在 API 文档中公开。如果为 None(默认),则使用函数名称作为 API 端点。如果为 False,则端点将不会在 API 文档中公开,并且下游应用程序(包括通过 `gr.load` 加载此应用程序的应用程序)将无法使用此事件。
show_progress: Literal['full', 'minimal', 'hidden']
= "full"
事件运行时如何显示进度动画:“full”显示一个旋转器,覆盖输出组件区域和右上角的运行时显示,“minimal”仅显示运行时显示,“hidden”完全不显示进度动画。
show_progress_on: Component | list[Component] | None
= None
显示进度动画的组件或组件列表。如果为 None,将在所有输出组件上显示进度动画。
queue: bool
= True
如果为 True,如果队列已启用,则会将请求放入队列。如果为 False,即使队列已启用,也不会将此事件放入队列。如果为 None,则将使用 Gradio 应用程序的队列设置。
batch: bool
= False
如果为 True,则函数应处理一批输入,这意味着它应为每个参数接受一个输入值列表。这些列表的长度应相等(且长度不超过 `max_batch_size`)。然后,函数*必须*返回一个列表元组(即使只有一个输出组件),元组中的每个列表对应一个输出组件。
preprocess: bool
= True
如果为 False,则在运行 'fn' 之前不会对组件数据进行预处理(例如,如果此方法使用 `Image` 组件调用,则将其保留为 base64 字符串)。
cancels: dict[str, Any] | list[dict[str, Any]] | None
= None
当此监听器触发时要取消的其他事件列表。例如,设置 cancels=[click_event] 将取消 click_event,其中 click_event 是另一个组件的 .click 方法的返回值。尚未运行的函数(或正在迭代的生成器)将被取消,但当前正在运行的函数将允许完成。
trigger_mode: Literal['once', 'multiple', 'always_last'] | None
= None
如果为 "once"(所有事件的默认值,除了 `.change()`),则在事件待处理时不允许任何提交。如果设置为 "multiple",则在待处理期间允许无限次提交,而 "always_last"(`.change()` 和 `.key_up()` 事件的默认值)则允许在待处理事件完成后进行第二次提交。
js: str | Literal[True] | None
= None
在运行 'fn' 之前运行的可选前端 JS 方法。JS 方法的输入参数是 'inputs' 和 'outputs' 的值,返回应为输出组件的值列表。
concurrency_limit: int | None | Literal['default']
= "default"
如果设置,这是可以同时运行此事件的最大数量。可以设置为 None 表示没有并发限制(可以同时运行任意数量的此事件)。设置为 "default" 表示使用默认并发限制(由 `Blocks.queue()` 中的 `default_concurrency_limit` 参数定义,其本身默认为 1)。
concurrency_id: str | None
= None
如果设置,这是并发组的 ID。具有相同 concurrency_id 的事件将受最低设置的 concurrency_limit 限制。