模块
lazyllm.module.ModuleBase
ModuleBase 是 LazyLLM 的核心基类,定义了所有模块的统一接口和基础能力。
它抽象了模块的训练、部署、推理和评测逻辑,并提供了子模块管理、钩子注册、参数传递和递归更新等机制。
用户自定义的模块需要继承 ModuleBase,并实现 forward 方法来定义具体的推理逻辑。
功能特性
- 统一管理子模块 (submodules),自动追踪被持有的 ModuleBase 实例。
- 支持 Option 类型的超参数设置,方便网格搜索与自动调参。
- 提供钩子 (hook) 机制,可在调用前后执行自定义逻辑。
- 封装训练 (train)、服务部署 (server)、评测 (eval) 的更新流程。
- 支持 evalset 的加载与自动并行推理评测。
Parameters:
-
return_trace(bool, default:False) –是否将推理结果写入 trace 队列,用于调试和追踪。默认为
False。
使用场景
- 当你需要组合训练、部署、推理和评测中的部分或全部能力时,例如一个 Embedding 模型需要同时训练与推理。
- 当你希望通过根模块调用
start、update、eval等方法,递归管理其持有的子模块。 - 当你希望用户参数从外层模块自动传递到内部实现(参考 WebModule)。
- 当你希望自定义模块支持参数网格搜索(参考 TrialModule)。
Examples:
>>> import lazyllm
>>> class Module(lazyllm.module.ModuleBase):
... pass
...
>>> class Module2(lazyllm.module.ModuleBase):
... def __init__(self):
... super(__class__, self).__init__()
... self.m = Module()
...
>>> m = Module2()
>>> m.submodules
[<Module type=Module>]
>>> m.m3 = Module()
>>> m.submodules
[<Module type=Module>, <Module type=Module>]
Source code in lazyllm/module/module.py
325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 | |
eval(*, recursive=True)
对模块(及所有的子模块)进行评测。当模块通过 evalset 设置了评测集之后,本函数生效。
Parameters:
-
recursive(bool, default:True) –是否递归评测所有的子模块,默认为True
Examples:
>>> import lazyllm
>>> class MyModule(lazyllm.module.ModuleBase):
... def forward(self, input):
... return f'reply for input'
...
>>> m = MyModule()
>>> m.evalset([1, 2, 3])
>>> m.eval().eval_result
['reply for input', 'reply for input', 'reply for input']
Source code in lazyllm/module/module.py
evalset(evalset, load_f=None, collect_f=lambda x: x)
为模块设置评测集(evaluation set)。
模块在调用 update 或 eval 时会使用评测集进行推理,并将评测结果存储在 eval_result 变量中。
Parameters:
-
evalset(Union[list, str]) –评测数据列表,或者评测数据文件路径。
-
load_f(Optional[Callable], default:None) –当
evalset为文件路径时,用于加载文件并返回列表的函数,默认为 None。 -
collect_f(Callable, default:lambda x: x) –对评测结果进行后处理的函数,默认为
lambda x: x。
Examples:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(lazyllm.deploy.dummy).finetune_method(lazyllm.finetune.dummy).trainset("").mode("finetune").prompt(None)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> print(m.eval_result)
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
Source code in lazyllm/module/module.py
forward(*args, **kw)
前向计算接口,需要子类实现。
该方法定义了模块接收输入并返回输出的逻辑,是模块作为仿函数的核心函数。
Parameters:
-
*args–可变位置参数,子类可根据实际需求定义输入。
-
**kw–可变关键字参数,子类可根据实际需求定义输入。
start()
启动模块及所有子模块的部署服务。该方法会确保模块和子模块的 server 功能被执行,适合用于初始化或重新启动服务。
Returns:
- ModuleBase: 返回自身实例,以支持链式调用
Examples:
>>> import lazyllm
>>> m = lazyllm.TrainableModule().deploy_method(lazyllm.deploy.dummy).prompt(None)
>>> m.start()
<Module type=Trainable mode=None basemodel= target= stream=False return_trace=False>
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/module.py
restart()
重启模块及其子模块的部署服务。内部会调用 start 方法,实现服务的重新启动。
Returns:
- ModuleBase: 返回自身实例,以支持链式调用
Examples:
>>> import lazyllm
>>> m = lazyllm.TrainableModule().deploy_method(lazyllm.deploy.dummy).prompt(None)
>>> m.restart()
<Module type=Trainable mode=None basemodel= target= stream=False return_trace=False>
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/module.py
update(*, recursive=True)
更新模块(及所有的子模块)。当模块重写了 _get_train_tasks 方法后,模块会被更新。更新完后会自动进入部署和推理的流程。
Parameters:
-
recursive(bool, default:True) –是否递归更新所有的子模块,默认为True
Examples:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(lazyllm.finetune.dummy).trainset("").deploy_method(lazyllm.deploy.dummy).mode('finetune').prompt(None)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> print(m.eval_result)
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
Source code in lazyllm/module/module.py
stream_output(stream_output=None)
上下文管理器,用于在推理或执行过程中进行流式输出。
当提供字典类型的 stream_output 时,可指定输出前缀和后缀,以及对应颜色。
Parameters:
-
stream_output(Optional[Union[bool, Dict]], default:None) –流式输出配置。
- 如果为布尔值 True,则开启默认流式输出。
-
如果为字典,可包含以下键:
- 'prefix' (str): 输出前缀文本。
- 'prefix_color' (str, optional): 前缀颜色。
- 'suffix' (str): 输出后缀文本。
- 'suffix_color' (str, optional): 后缀颜色。
Source code in lazyllm/module/module.py
used_by(module_id)
设置当前模块被哪个模块使用,用于标记模块的调用关系。
可链式调用,返回模块自身。
Parameters:
-
module_id(str) –调用该模块的上层模块的唯一 ID。
Returns:
- ModuleBase: 返回模块自身,用于链式调用。
register_hook(hook_type)
注册一个钩子(Hook),在模块调用时执行特定逻辑。
钩子需要继承自 LazyLLMHook,可用于在模块前向计算前后添加自定义操作,例如日志记录或统计。
Parameters:
-
hook_type(LazyLLMHook) –待注册的钩子对象。
Source code in lazyllm/module/module.py
unregister_hook(hook_type)
clear_hooks()
update_server(*, recursive=True)
更新模块及其子模块的部署(server)部分。当模块或子模块实现了部署功能时,会进行相应的服务启动。
Parameters:
-
recursive(bool, default:True) –是否递归更新所有子模块的部署任务,默认为 True。
wait()
stop()
for_each(filter, action)
对模块的所有子模块执行指定操作。递归遍历所有子模块,如果子模块满足 filter 条件,则执行 action。
Parameters:
-
filter(Callable) –接受子模块作为输入并返回布尔值的函数,用于判断是否执行操作。
-
action(Callable) –对满足条件的子模块执行的操作函数。
Source code in lazyllm/module/module.py
lazyllm.module.servermodule.LLMBase
Bases: object
大语言模型模块的基类,继承自 ModuleBase。
负责管理流式输出、Prompt 和格式化器的初始化与切换,处理输入中的文件信息,支持实例共享。
Parameters:
-
stream(bool 或 dict, default:False) –是否启用流式输出或流式配置,默认为 False。
-
return_trace(bool) –是否返回执行过程的 trace,默认为 False。
-
init_prompt(bool, default:True) –是否在初始化时自动创建默认 Prompt,默认为 True。
Source code in lazyllm/module/servermodule.py
55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 | |
prompt(prompt=None, history=None)
设置或切换 Prompt。支持 None、PrompterBase 子类或字符串/字典类型创建 ChatPrompter。
Parameters:
-
prompt(str / dict / PrompterBase / None, default:None) –要设置的 Prompt。
-
history(list, default:None) –对话历史,仅当 prompt 为字符串或字典时有效。
Returns:
- self: 便于链式调用。
Source code in lazyllm/module/servermodule.py
formatter(format=None)
设置或切换输出格式化器。支持 None、FormatterBase 子类或可调用对象。
Parameters:
-
format(FormatterBase / Callable / None, default:None) –格式化器对象或函数,默认为 None。
Returns:
- self: 便于链式调用。
Source code in lazyllm/module/servermodule.py
share(prompt=None, format=None, stream=None, history=None)
创建当前实例的浅拷贝,并可重新设置 prompt、formatter、stream 等属性。
适用于多会话或多 Agent 共享基础配置但个性化部分参数的场景。
Parameters:
-
prompt(str / dict / PrompterBase / None, default:None) –新的 Prompt,可选。
-
format(FormatterBase / None, default:None) –新的格式化器,可选。
-
stream(bool / dict / None, default:None) –新的流式设置,可选。
-
history(list / None, default:None) –新的对话历史,仅在设置 Prompt 时有效。
Returns:
- LLMBase: 新的共享实例。
Source code in lazyllm/module/servermodule.py
lazyllm.module.ActionModule
Bases: ModuleBase
用于将函数、模块、flow、Module等可调用的对象包装一个Module。被包装的Module(包括flow中的Module)都会变成该Module的submodule。
Parameters:
-
action(Callable | list[Callable], default:()) –被包装的对象,是一个或一组可执行的对象。
-
return_trace(bool, default:False) –是否开启 trace 模式,用于记录调用栈,默认为
False。
Source code in lazyllm/module/module.py
submodules
property
返回被包装 action 中所有属于 ModuleBase 类型的子模块。该属性会自动展开 Pipeline 中嵌套的模块。
Returns:
- list[ModuleBase]: 子模块列表
forward(*args, **kw)
执行被包装的 action,对输入参数进行前向计算。等效于调用该模块本身。
Parameters:
-
args(list of callables or single callable, default:()) –传递给被包装 action 的位置参数。
-
kwargs(dict of callables) –传递给被包装 action 的关键字参数。
Returns:
- 任意类型:被包装 action 的执行结果。
Source code in lazyllm/module/module.py
lazyllm.module.TrainableModule
Bases: UrlModule
可训练模块,所有模型(包括LLM、Embedding等)都通过TrainableModule提供服务
TrainableModule(base_model='', target_path='', *, stream=False, return_trace=False)
Parameters:
-
base_model(str, default:'') –基础模型的名称或路径。
-
target_path(str, default:'') –保存微调任务的路径。
-
stream(bool, default:False) –输出流式结果。
-
return_trace(bool, default:False) –在trace中记录结果。
-
trust_remote_code(bool, default:True) –是否信任远程代码。
-
type(str / LLMType, default:None) –模型类型。
-
source(str, default:None) –模型来源,如果未设置,将从环境变量LAZYLLM_MODEL_SOURCE读取。
TrainableModule.trainset(v):
设置 TrainableModule 的训练集
Parameters:
-
v(str) –训练/微调数据集的路径
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).trainset('/file/to/path').deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
TrainableModule.train_method(v, **kw):
设置 TrainableModule 的训练方法(暂不支持继续预训练,预计下一版本支持)
Parameters:
-
v(LazyLLMTrainBase) –训练方法,可选值包括
train.auto等 -
kw(**dict) –训练方法所需的参数,对应 v 的参数
TrainableModule.finetune_method(v, **kw):
设置 TrainableModule 的微调方法及其参数
Parameters:
-
v(LazyLLMFinetuneBase) –微调方法,可选值包括
finetune.auto/finetune.alpacalora/finetune.collie等 -
kw(**dict) –微调方法所需的参数,对应 v 的参数
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
TrainableModule.deploy_method(v, **kw):
设置 TrainableModule 的部署方法及其参数
Parameters:
-
v(LazyLLMDeployBase) –部署方法,可选值包括
deploy.auto/deploy.lightllm/deploy.vllm等 -
kw(**dict) –部署方法所需的参数,对应 v 的参数
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy).mode('finetune')
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> m.eval_result
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
TrainableModule.mode(v):
设置 TrainableModule 在 update 时执行训练还是微调
Parameters:
-
v(str) –设置在 update 时执行训练还是微调,可选值为 'finetune' 和 'train',默认为 'finetune'
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
eval(*, recursive=True)
评估该模块(及其所有子模块)。此功能需在模块通过evalset设置评估集后生效。
Parameters:
-
recursive (bool)–是否递归评估所有子模块,默认为True。
evalset(evalset, load_f=None, collect_f=<function ModuleBase.<lambda>>)
为模块设置评估集。已设置评估集的模块将在执行update或eval时进行评估,评估结果将存储在eval_result变量中。
evalset(evalset, collect_f=lambda x: ...)→ None
Parameters:
-
evalset (list)–评估数据集
-
collect_f (Callable)–评估结果的后处理方法,默认不进行后处理。
evalset(evalset, load_f=None, collect_f=lambda x: ...)→ None
Parameters:
-
evalset (str)–评估集路径
-
load_f (Callable)–评估集加载方法,包括文件格式解析和列表转换
-
collect_f (Callable)–评估结果后处理方法,默认不进行后处理
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> m.eval_result
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
restart()
重启模块及其所有子模块
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.restart()
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
start()
部署模块及其所有子模块
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.start()
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/llms/trainablemodule.py
264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 | |
wait()
stop(task_name=None)
暂停模型特定任务。
Parameters:
-
task_name(str, default:None) –需要暂停的任务名, 默认为None(默认暂停deploy任务)
Examples:
>>> import lazyllm
>>> class Mystop(lazyllm.module.llms.TrainableModule):
... def forward(self, task):
... self.stop(task)
Source code in lazyllm/module/llms/trainablemodule.py
prompt(prompt='', history=None)
处理输入的prompt生成符合模型需求的格式。
Parameters:
-
prompt(str, default:'') –输入的prompt, 默认为空。
-
history(**List, default:None) –对话历史记忆。
Examples:
>>> import lazyllm
>>> class Myprompt(lazyllm.module.llms.TrainableModule):
... def forward(self, prompt, history):
... self.prompt(prompt,history)
Source code in lazyllm/module/llms/trainablemodule.py
log_path(task_name=None)
获取任务日志路径。
根据任务名称获取对应的日志文件路径,支持默认部署任务和手动指定任务。
Parameters:
-
task_name(Optional[str], default:None) –任务名称,默认为None(获取默认部署任务日志)
Returns:
-
str–日志文件路径
Source code in lazyllm/module/llms/trainablemodule.py
forward_openai(__input=package(), *, llm_chat_history=None, lazyllm_files=None, tools=None, stream_output=False, **kw)
使用OpenAI兼容接口进行前向推理。
通过OpenAI标准API格式调用部署的模型服务,支持聊天历史、文件处理、工具调用和流式输出。
Parameters:
-
__input(Union[Tuple[Union[str, Dict], str], str, Dict], default:package()) –输入数据,可以是文本、字典或打包数据
-
llm_chat_history–聊天历史记录
-
lazyllm_files–文件数据
-
tools–工具调用配置
-
stream_output(bool, default:False) –是否流式输出
-
**kw–其他关键字参数
Returns:
-
–
模型推理结果
Source code in lazyllm/module/llms/trainablemodule.py
forward_standard(__input=package(), *, llm_chat_history=None, lazyllm_files=None, tools=None, stream_output=False, **kw)
使用标准接口进行前向推理。
通过自定义标准API格式调用部署的模型服务,支持模板消息、文件编码和流式输出。
Parameters:
-
__input(Union[Tuple[Union[str, Dict], str], str, Dict], default:package()) –输入数据,可以是文本、字典或打包数据
-
llm_chat_history–聊天历史记录
-
lazyllm_files–文件数据
-
tools–工具调用配置
-
stream_output(bool, default:False) –是否流式输出
-
**kw–其他关键字参数
Returns:
-
–
模型推理结果
Source code in lazyllm/module/llms/trainablemodule.py
forward(__input=package(), *, llm_chat_history=None, lazyllm_files=None, tools=None, stream_output=False, **kw)
自动构建符合模型要求的输入数据结构,适配多模态场景。
Examples:
>>> import lazyllm
>>> from lazyllm.module import TrainableModule
>>> class MyModule(TrainableModule):
... def forward(self, __input, **kw):
... return f"processed: {__input}"
...
>>> MyModule()("Hello")
'processed: Hello'
Source code in lazyllm/module/llms/trainablemodule.py
lazyllm.module.UrlModule
Bases: ModuleBase, LLMBase, _UrlHelper
可以将ServerModule部署得到的Url包装成一个Module,调用 __call__ 时会访问该服务。
Parameters:
-
url(str, default:'') –要包装的服务的Url,默认为空字符串
-
stream(bool | Dict[str, str], default:False) –是否流式请求和输出,默认为非流式
-
return_trace(bool, default:False) –是否将结果记录在trace中,默认为False
-
init_prompt(bool, default:True) –是否初始化prompt,默认为True
Examples:
>>> import lazyllm
>>> def demo(input): return input * 2
...
>>> s = lazyllm.ServerModule(demo, launcher=lazyllm.launchers.empty(sync=False))
>>> s.start()
INFO: Uvicorn running on http://0.0.0.0:35485
>>> u = lazyllm.UrlModule(url=s._url)
>>> print(u(1))
2
Source code in lazyllm/module/servermodule.py
219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 | |
lazyllm.module.ServerModule
Bases: UrlModule
ServerModule 类,继承自 UrlModule,封装了将任意可调用对象部署为 API 服务的能力。
通过 FastAPI 实现,可以启动一个主服务和多个卫星服务,并支持流式调用、预处理和后处理逻辑。
既可以传入本地可调用对象启动服务,也可以通过 URL 直接连接远程服务。
Parameters:
-
m(Optional[Union[str, ModuleBase]], default:None) –被包装成服务的模块或其名称。若为字符串则表示 URL,此时
url必须为 None;若为 ModuleBase 则包装为服务。 -
pre(Optional[Callable], default:None) –前处理函数,在服务进程执行,默认为
None。 -
post(Optional[Callable], default:None) –后处理函数,在服务进程执行,默认为
None。 -
stream(Union[bool, Dict], default:False) –是否开启流式输出。可以是布尔值,或包含流式配置的字典,默认为
False。 -
return_trace(Optional[bool], default:False) –是否返回调试追踪信息。默认为
False。 -
port(Optional[int], default:None) –指定服务部署的端口。默认为
None,将自动分配端口。 -
pythonpath(Optional[str], default:None) –传递给子进程的 PYTHONPATH 环境变量,默认为
None。 -
launcher(Optional[LazyLLMLaunchersBase], default:None) –启动服务所使用的 Launcher,默认使用异步远程部署。
-
url(Optional[str], default:None) –已部署服务的 URL 地址。若提供,则
m必须为 None。
Examples:
>>> import lazyllm
>>> def demo(input): return input * 2
...
>>> s = lazyllm.ServerModule(demo, launcher=launchers.empty(sync=False))
>>> s.start()
INFO: Uvicorn running on http://0.0.0.0:35485
>>> print(s(1))
2
>>> class MyServe(object):
... def __call__(self, input):
... return 2 * input
...
... @lazyllm.FastapiApp.post
... def server1(self, input):
... return f'reply for {input}'
...
... @lazyllm.FastapiApp.get
... def server2(self):
... return f'get method'
...
>>> m = lazyllm.ServerModule(MyServe(), launcher=launchers.empty(sync=False))
>>> m.start()
INFO: Uvicorn running on http://0.0.0.0:32028
>>> print(m(1))
2
Source code in lazyllm/module/servermodule.py
334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 | |
wait()
lazyllm.module.AutoModel
用于快速创建在线推理模块 OnlineModule 或本地 TrainableModule 的工厂类。它会优先采用用户传入的参数,若开启 config 则会根据 auto_model_config_map 中的配置进行覆盖,然后自动判断应当构建在线模块还是本地模块:
-
当判定为在线模块时,参数会透传给 OnlineModule(自动匹配 OnlineChatModule / OnlineEmbeddingModule / OnlineMultiModalModule)。
-
当判定为本地模块时,则以
model与用户参数初始化 TrainableModule,并读取 config map 里的配置参数。
Parameters:
-
model(str) –指定模型名称。例如
Qwen3-32B。必填。 -
config_id(Optional[str]) –指定配置文件里的id。默认为空。
-
source(Optional[str]) –使用的服务提供方。为在线模块(
OnlineModule)指定qwen/glm/openai等;若设为local则强制创建本地 TrainableModule。 -
type(Optional[str]) –模型类型。若未指定会尝试从 kwargs 中获取或由在线模块自动推断。
-
config(Union[str, bool]) –是否启用
auto_model_config_map的覆盖逻辑,或者用户指定的 config 文件路径。默认为 True。 -
**kwargs–兼容
model的同义字段base_model和embed_model_name,不接收其他用户传入的字段。
Source code in lazyllm/module/llms/automodel.py
lazyllm.module.TrialModule
Bases: object
参数网格搜索模块,会遍历其所有的submodule,收集所有的可被搜索的参数,遍历这些参数进行微调、部署和评测
Parameters:
-
m(Callable) –被网格搜索参数的子模块,微调、部署和评测都会基于这个模块进行
Examples:
>>> import lazyllm
>>> from lazyllm import finetune, deploy
>>> m = lazyllm.TrainableModule('b1', 't').finetune_method(finetune.dummy, **dict(a=lazyllm.Option(['f1', 'f2'])))
>>> m.deploy_method(deploy.dummy).mode('finetune').prompt(None)
>>> s = lazyllm.ServerModule(m, post=lambda x, ori: f'post2({x})')
>>> s.evalset([1, 2, 3])
>>> t = lazyllm.TrialModule(s)
>>> t.update()
>>>
dummy finetune!, and init-args is {a: f1}
dummy finetune!, and init-args is {a: f2}
[["post2(reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1})"], ["post2(reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1})"]]
Source code in lazyllm/module/trialmodule.py
update()
遍历模块的所有配置选项,使用多进程并行执行模块更新,并收集每个配置的评测结果。
Source code in lazyllm/module/trialmodule.py
work(m, q)
staticmethod
静态方法,用于在子进程中复制模块、执行更新操作,并将评测结果放入队列中。
Parameters:
-
m(Callable) –要执行更新操作的模块。
-
q(Queue) –用于存放评测结果的队列。
Source code in lazyllm/module/trialmodule.py
lazyllm.module.OnlineChatModule
用来管理创建目前市面上公开的大模型平台访问模块,目前支持openai、sensenova、glm、kimi、qwen、doubao、ppio、deekseek(由于该平台暂时不让充值了,暂时不支持访问)。平台的api key获取方法参见 开始入门
Parameters:
-
model(str) –指定要访问的模型 (注意使用豆包时需用 Model ID 或 Endpoint ID,获取方式详见 获取推理接入点。使用模型前,要先在豆包平台开通对应服务。),默认为
gpt-3.5-turbo(openai)/SenseChat-5(sensenova)/glm-4(glm)/moonshot-v1-8k(kimi)/qwen-plus(qwen)/mistral-7b-instruct-v0.2(doubao)/deepseek/deepseek-v3.2(ppio) -
source(str) –指定要创建的模块类型,可选为
openai/sensenova/glm/kimi/qwen/doubao/ppio/deepseek(暂时不支持访问) -
base_url(str) –指定要访问的平台的基础链接,默认是官方链接
-
system_prompt(str) –指定请求的system prompt,默认是官方给的system prompt
-
stream(bool) –是否流式请求和输出,默认为流式
-
return_trace(bool) –是否将结果记录在trace中,默认为False
Examples:
>>> import lazyllm
>>> from functools import partial
>>> m = lazyllm.OnlineChatModule(source="sensenova", stream=True)
>>> query = "Hello!"
>>> with lazyllm.ThreadPoolExecutor(1) as executor:
... future = executor.submit(partial(m, llm_chat_history=[]), query)
... while True:
... if value := lazyllm.FileSystemQueue().dequeue():
... print(f"output: {''.join(value)}")
... elif future.done():
... break
... print(f"ret: {future.result()}")
...
output: Hello
output: ! How can I assist you today?
ret: Hello! How can I assist you today?
>>> from lazyllm.components.formatter import encode_query_with_filepaths
>>> vlm = lazyllm.OnlineChatModule(source="sensenova", model="SenseChat-Vision")
>>> query = "what is it?"
>>> inputs = encode_query_with_filepaths(query, ["/path/to/your/image"])
>>> print(vlm(inputs))
Source code in lazyllm/module/llms/onlinemodule/chat.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoChat
Bases: OnlineChatModuleBase
豆包(Doubao)在线聊天模块,继承自 OnlineChatModuleBase。
封装了对字节跳动 Doubao API 的调用,用于进行多轮问答交互。默认使用模型 doubao-1-5-pro-32k-250115,支持流式输出和调用链追踪。
Parameters:
-
model(str, default:None) –使用的模型名称,默认为
doubao-1-5-pro-32k-250115。 -
base_url(str, default:'https://ark.cn-beijing.volces.com/api/v3/') –API 基础 URL,默认为 "https://ark.cn-beijing.volces.com/api/v3/"。
-
api_key(Optional[str], default:None) –Doubao API Key,若未提供,则从 lazyllm.config['doubao_api_key'] 读取。
-
stream(bool, default:True) –是否启用流式输出,默认为 True。
-
return_trace(bool, default:False) –是否返回调用链追踪信息,默认为 False。
-
**kwargs–其他传递给基类 OnlineChatModuleBase 的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.llms.onlinemodule.supplier.ppio.PPIOChat
Bases: OnlineChatModuleBase
PPIO(派欧云)在线聊天模块,继承自 OnlineChatModuleBase。
封装了对 PPIO (Paiou Cloud) API 的调用,用于进行多轮问答交互。默认使用模型 deepseek/deepseek-v3.2,支持流式输出和调用链追踪。PPIO 提供 OpenAI 兼容的 API 接口。
Parameters:
-
model(str, default:'deepseek/deepseek-v3.2') –使用的模型名称,默认为
deepseek/deepseek-v3.2。 -
base_url(str, default:'https://api.ppinfra.com/openai/') –API 基础 URL,默认为 "https://api.ppinfra.com/openai"。
-
api_key(Optional[str], default:None) –PPIO API Key,若未提供,则从 lazyllm.config['ppio_api_key'] 读取。
-
stream(bool, default:True) –是否启用流式输出,默认为 True。
-
return_trace(bool, default:False) –是否返回调用链追踪信息,默认为 False。
-
**kwargs–其他传递给基类 OnlineChatModuleBase 的参数。
Examples:
>>> import lazyllm
>>> # Set environment variable: export LAZYLLM_PPIO_API_KEY=your_api_key
>>> # Or create config file ~/.lazyllm/config.json: {"ppio_api_key": "your_api_key"}
>>> chat = lazyllm.OnlineChatModule(source='ppio', model='deepseek/deepseek-v3.2')
>>> response = chat('Hello, how are you?')
>>> print(response)
Source code in lazyllm/module/llms/onlinemodule/supplier/ppio.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoMultiModal
豆包多模态模块,继承自 OnlineMultiModalBase,封装了调用豆包多模态服务的能力。
可通过指定 API Key、模型名称和服务基础 URL,远程调用豆包接口进行多模态数据处理和特征提取。
Parameters:
-
api_key(Optional[str], default:None) –访问豆包服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
model_name(Optional[str]) –使用的豆包多模态模型名称。
-
base_url(str) –豆包服务的基础 URL,默认指向北京区域的服务地址。
-
return_trace(bool) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 OnlineMultiModalBase 的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.OnlineEmbeddingModule
用来管理创建目前市面上的在线Embedding服务模块,目前支持openai、sensenova、glm、qwen、doubao
Parameters:
-
source(str) –指定要创建的模块类型,可选为
openai/sensenova/glm/qwen/doubao -
embed_url(str) –指定要访问的平台的基础链接,默认是官方链接
-
embed_mode_name(str) –指定要访问的模型 (注意使用豆包时需用 Model ID 或 Endpoint ID,获取方式详见 获取推理接入点。使用模型前,要先在豆包平台开通对应服务。),默认为
text-embedding-ada-002(openai)/nova-embedding-stable(sensenova)/embedding-2(glm)/text-embedding-v1(qwen)/doubao-embedding-text-240715(doubao)
Examples:
>>> import lazyllm
>>> m = lazyllm.OnlineEmbeddingModule(source="sensenova")
>>> emb = m("hello world")
>>> print(f"emb: {emb}")
emb: [0.0010528564, 0.0063285828, 0.0049476624, -0.012008667, ..., -0.009124756, 0.0032043457, -0.051696777]
Source code in lazyllm/module/llms/onlinemodule/embedding.py
lazyllm.module.llms.onlinemodule.supplier.openai.OpenAIEmbed
Bases: LazyLLMOnlineEmbedModuleBase
OpenAI 在线嵌入模块。
该类封装了对 OpenAI 嵌入 API 的调用,默认使用模型 text-embedding-ada-002,用于将文本编码为向量表示。
Parameters:
-
embed_url(str, default:'https://api.openai.com/v1/') –OpenAI 嵌入 API 的 URL,默认为 "https://api.openai.com/v1/embeddings"。
-
embed_model_name(str, default:'text-embedding-ada-002') –使用的嵌入模型名称,默认为 "text-embedding-ada-002"。
-
api_key(str, default:None) –OpenAI 的 API Key。若未提供,则从 lazyllm.config 中读取。
Source code in lazyllm/module/llms/onlinemodule/supplier/openai.py
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenSTT
Bases: LazyLLMOnlineSTTModuleBase, QwenMultiModal
基于千问多模态接口的语音转文本(STT)模块,默认使用 paraformer-v2 模型。
Parameters:
-
model(str, default:None) –模型名称。默认为
None,将依次从lazyllm.config['qwen_stt_model_name']或QwenSTT.MODEL_NAME获取。 -
api_key(str, default:None) –千问 API 的密钥。默认为
None。 -
return_trace(bool, default:False) –是否返回推理的中间 trace 信息。默认为
False。 -
**kwargs–传递给父类
QwenMultiModal的额外参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
lazyllm.module.OnlineChatModuleBase = LazyLLMOnlineChatModuleBase
module-attribute
lazyllm.module.OnlineEmbeddingModuleBase
Bases: LazyLLMOnlineBase
OnlineEmbeddingModuleBase是管理开放平台的嵌入模型接口的基类,用于请求文本获取嵌入向量。不建议直接对该类进行直接实例化。需要特定平台类继承该类进行实例化。
如果你需要支持新的开放平台的嵌入模型的能力,请让你自定义的类继承自OnlineEmbeddingModuleBase:
- 如果新平台的嵌入模型的请求和返回数据格式都和openai一样,可以不用做任何处理,只传url和模型即可
- 如果新平台的嵌入模型的请求或者返回的数据格式和openai不一样,需要重写_encapsulated_data或_parse_response方法。
- 配置新平台支持的api_key到全局变量,通过lazyllm.config.add(变量名,类型,默认值,环境变量名)进行添加
Parameters:
-
embed_url(str) –嵌入API的URL地址。
-
api_key(str) –API访问密钥。
-
embed_model_name(str) –嵌入模型名称。
-
return_trace(bool, default:False) –是否返回追踪信息,默认为False。
Examples:
>>> import lazyllm
>>> from lazyllm.module import OnlineEmbeddingModuleBase
>>> class NewPlatformEmbeddingModule(OnlineEmbeddingModuleBase):
... def __init__(self,
... embed_url: str = '<new platform embedding url>',
... embed_model_name: str = '<new platform embedding model name>'):
... super().__init__(embed_url, lazyllm.config['new_platform_api_key'], embed_model_name)
...
>>> class NewPlatformEmbeddingModule1(OnlineEmbeddingModuleBase):
... def __init__(self,
... embed_url: str = '<new platform embedding url>',
... embed_model_name: str = '<new platform embedding model name>'):
... super().__init__(embed_url, lazyllm.config['new_platform_api_key'], embed_model_name)
...
... def _encapsulated_data(self, text:str, **kwargs):
... pass
... return json_data
...
... def _parse_response(self, response: dict[str, any]):
... pass
... return embedding
Source code in lazyllm/module/llms/onlinemodule/base/onlineEmbeddingModuleBase.py
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 | |
run_embed_batch(input, data, proxies, url=None, **kwargs)
执行批量嵌入处理的内部方法。
此方法负责处理批量文本嵌入请求,支持单线程和多线程两种处理模式。 当遇到请求失败时,会自动调整批处理大小并重试,提供健壮的错误处理机制。
Parameters:
-
input(List) –原始的输入文本列表
-
data(List) –封装好的批量请求数据列表
-
proxies–代理设置,如果NO_PROXY为True则设置为None
-
url(str, default:None) –本次请求使用的完整接口地址,默认为初始传入的 embed_url
-
**kwargs–其他关键字参数
Returns:
- 嵌入向量列表的列表,每个子列表对应一个输入文本的嵌入向量
Source code in lazyllm/module/llms/onlinemodule/base/onlineEmbeddingModuleBase.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoEmbed
Bases: LazyLLMOnlineEmbedModuleBase
豆包嵌入类,继承自 OnlineEmbeddingModuleBase,封装了调用豆包在线文本嵌入服务的功能。
通过指定服务接口 URL、模型名称及 API Key,支持远程获取文本向量表示。
Parameters:
-
embed_url(Optional[str], default:'https://ark.cn-beijing.volces.com/api/v3/embeddings') –豆包文本嵌入服务的接口 URL,默认指向北京区域的服务地址。
-
embed_model_name(Optional[str], default:'doubao-embedding-text-240715') –使用的豆包嵌入模型名称,默认为 "doubao-embedding-text-240715"。
-
api_key(Optional[str], default:None) –访问豆包服务的 API Key,若未提供则从 lazyllm 配置中读取。
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoMultimodalEmbed
Bases: LazyLLMOnlineMultimodalEmbedModuleBase
豆包多模态嵌入类,继承自 OnlineEmbeddingModuleBase,封装了调用豆包在线多模态(文本+图像)嵌入服务的功能。
支持将文本和图像输入转换为统一的向量表示,通过指定服务接口 URL、模型名称及 API Key,实现远程获取多模态向量。
Parameters:
-
embed_url(Optional[str], default:'https://ark.cn-beijing.volces.com/api/v3/embeddings/multimodal') –豆包多模态嵌入服务的接口 URL,默认指向北京区域的服务地址。
-
embed_model_name(Optional[str], default:None) –使用的豆包多模态嵌入模型名称,默认为 "doubao-embedding-vision-241215"。
-
api_key(Optional[str], default:None) –访问豆包服务的 API Key,若未提供则从 lazyllm 配置中读取。
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.llms.onlinemodule.supplier.glm.GLMChat
Bases: OnlineChatModuleBase, FileHandlerBase
GLMChat 类,继承自 OnlineChatModuleBase 和 FileHandlerBase,封装了对智谱 GLM 系列模型的在线调用功能。
支持对话生成、文件处理以及模型微调等能力。默认使用 GLM-4 模型,也可指定其他训练型模型(如 chatglm3-6b、chatglm_12b 等)。
Parameters:
-
base_url(Optional[str], default:'https://open.bigmodel.cn/api/paas/v4/') –智谱 GLM 服务的 API 接口地址,默认为 "https://open.bigmodel.cn/api/paas/v4/"。
-
model(Optional[str], default:None) –使用的 GLM 模型名称,默认为 "glm-4",也可选择 TRAINABLE_MODEL_LIST 中的其他模型。
-
api_key(Optional[str], default:None) –访问 GLM 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
stream(Optional[bool], default:True) –是否开启流式输出,默认为 True。
-
return_trace(Optional[bool], default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 OnlineChatModuleBase 的可选参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 | |
lazyllm.module.llms.onlinemodule.supplier.glm.GLMText2Image
Bases: LazyLLMOnlineText2ImageModuleBase, GLMMultiModal
GLM文本生成图像模块,继承自 GLMMultiModal,封装了调用 GLM CogView-4 模型生成图像的功能。
支持根据文本提示(prompt)生成指定数量和分辨率的图像,并可通过 API Key 调用远程服务。
Parameters:
-
model_name(Optional[str], default:None) –使用的 GLM 模型名称,默认使用 "cogview-4-250304" 或配置中的 'glm_text_to_image_model_name'。
-
api_key(Optional[str], default:None) –API Key,用于访问 GLM 图像生成服务。
-
return_trace(bool, default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 GLMMultiModal 的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenText2Image
Bases: LazyLLMOnlineText2ImageModuleBase, QwenMultiModal
Qwen文本生成图像模块和图像编辑模块,继承自 QwenMultiModal,封装了调用 Qwen Wanx2.1-t2i-turbo 模型生成图像的能力和调用Qwen-image-edit-plus模型进行图像编辑的能力。
支持根据文本提示生成指定数量和分辨率的图像,支持图像编辑,并可设置负面提示、随机种子及扩展提示功能,通过 DashScope API 远程调用服务。
Parameters:
-
model(Optional[str], default:None) –使用的 Qwen 模型名称,默认从配置 'qwen_text2image_model_name' 获取,若未设置则使用 "wanx2.1-t2i-turbo"。
-
api_key(Optional[str], default:None) –调用 DashScope 服务的 API Key。
-
return_trace(bool, default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 QwenMultiModal 的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 | |
lazyllm.module.llms.onlinemodule.supplier.kimi.KimiChat
Bases: OnlineChatModuleBase
KimiChat 类,继承自 OnlineChatModuleBase,封装了调用 Moonshot AI 提供的 Kimi 聊天服务的能力。
可通过指定 API Key、模型名称和服务 URL,支持中文和英文的安全问答交互,并支持图像输入的 base64 格式处理。
Parameters:
-
base_url(str, default:'https://api.moonshot.cn/') –Kimi 服务的基础 URL,默认为 "https://api.moonshot.cn/"。
-
model(str, default:'moonshot-v1-8k') –使用的 Kimi 模型名称,默认为 "moonshot-v1-8k"。
-
api_key(Optional[str], default:None) –访问 Kimi 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
stream(bool, default:True) –是否开启流式输出,默认为 True。
-
return_trace(bool, default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 OnlineChatModuleBase 的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/kimi.py
lazyllm.module.llms.onlinemodule.fileHandler.FileHandlerBase
FileHandlerBase 是处理微调数据文件的基类,主要用于验证和转换微调数据格式。
该类不支持直接实例化,需要子类继承并实现特定的文件格式转换逻辑。
功能包括:
1. 验证微调数据文件格式是否为标准的 .jsonl。
2. 检查每条数据是否包含符合规范的消息格式(包含 role 和 content 字段)。
3. 验证角色类型是否在允许范围内(system、knowledge、user、assistant)。
4. 确保每个对话示例包含至少一条 assistant 回复。
5. 提供临时文件存储机制,便于后续处理。
Examples:
>>> import lazyllm
>>> from lazyllm.module.llms.onlinemodule.fileHandler import FileHandlerBase
>>> import tempfile
>>> import json
>>> sample_data = [
... {"messages": [{"role": "user", "content": "Hello"}, {"role": "assistant", "content": "Hi there!"}]},
... {"messages": [{"role": "user", "content": "How are you?"}, {"role": "assistant", "content": "I'm doing well, thank you!"}]}
... ]
>>> with tempfile.NamedTemporaryFile(mode='w', suffix='.jsonl', delete=False) as f:
... for item in sample_data:
... f.write(json.dumps(item, ensure_ascii=False) + '
')
... temp_file_path = f.name
>>> class CustomFileHandler(FileHandlerBase):
... def _convert_file_format(self, filepath: str) -> str:
... with open(filepath, 'r', encoding='utf-8') as f:
... data = [json.loads(line) for line in f]
... converted_data = []
... for item in data:
... messages = item.get('messages', [])
... conversation = []
... for msg in messages:
... conversation.append(f"{msg['role']}: {msg['content']}")
... converted_data.append('
'.join(conversation))
... return '
---
'.join(converted_data)
>>> handler = CustomFileHandler()
>>> try:
... result = handler.get_finetune_data(temp_file_path)
... print("数据验证和转换成功")
... except Exception as e:
... print(f"错误: {e}")
... finally:
... import os
... os.unlink(temp_file_path)
Source code in lazyllm/module/llms/onlinemodule/fileHandler.py
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 | |
get_finetune_data(filepath)
获取并处理微调数据文件,包括验证文件格式和转换为目标平台支持的格式。
Parameters:
-
filepath(str) –微调数据文件的路径,必须是.jsonl格式
Source code in lazyllm/module/llms/onlinemodule/fileHandler.py
lazyllm.module.llms.onlinemodule.supplier.glm.GLMChat
Bases: OnlineChatModuleBase, FileHandlerBase
GLMChat 类,继承自 OnlineChatModuleBase 和 FileHandlerBase,封装了对智谱 GLM 系列模型的在线调用功能。
支持对话生成、文件处理以及模型微调等能力。默认使用 GLM-4 模型,也可指定其他训练型模型(如 chatglm3-6b、chatglm_12b 等)。
Parameters:
-
base_url(Optional[str], default:'https://open.bigmodel.cn/api/paas/v4/') –智谱 GLM 服务的 API 接口地址,默认为 "https://open.bigmodel.cn/api/paas/v4/"。
-
model(Optional[str], default:None) –使用的 GLM 模型名称,默认为 "glm-4",也可选择 TRAINABLE_MODEL_LIST 中的其他模型。
-
api_key(Optional[str], default:None) –访问 GLM 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
stream(Optional[bool], default:True) –是否开启流式输出,默认为 True。
-
return_trace(Optional[bool], default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 OnlineChatModuleBase 的可选参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 | |
lazyllm.module.llms.onlinemodule.supplier.glm.GLMRerank
Bases: LazyLLMOnlineRerankModuleBase
智谱AI的重排序模块,继承自OnlineEmbeddingModuleBase,用于对文档进行相关性重排序。
Parameters:
-
embed_url(str, default:'https://open.bigmodel.cn/api/paas/v4/rerank') –重排序API的基础URL,默认为"https://open.bigmodel.cn/api/paas/v4/rerank"。
-
embed_model_name(str, default:'rerank') –使用的模型名称,默认为"rerank"。
-
api_key(str, default:None) –智谱AI的API密钥,如果未提供则从lazyllm.config['glm_api_key']读取。
属性: type: 返回模型类型,固定为"ONLINE_RERANK"。
主要功能: - 对输入的查询和文档列表进行相关性重排序 - 支持自定义排序参数 - 返回每个文档的相关性得分
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
lazyllm.module.llms.onlinemodule.supplier.glm.GLMMultiModal
智谱AI的多模态基础模块,继承自OnlineMultiModalBase,用于处理多模态任务。
Parameters:
-
model_name(str) –模型名称。
-
api_key(str, default:None) –API密钥,如果未提供则从lazyllm.config['glm_api_key']读取。
-
base_url(str, default:'https://open.bigmodel.cn/api/paas/v4') –API的基础URL,默认为'https://open.bigmodel.cn/api/paas/v4'。
-
return_trace(bool) –是否返回调用追踪信息,默认为False。
-
**kwargs–其他传递给基类的参数。
功能特点:
1. 支持多模态输入处理
2. 使用ZhipuAI客户端进行API调用
3. 提供统一的多模态接口
4. 可自定义基础URL和API密钥
注意: 该类作为GLM多模态功能的基础类,通常作为其他具体多模态实现(如语音转文本、文本生成图像等)的父类。
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenRerank
Bases: LazyLLMOnlineRerankModuleBase
通义千问的重排序模块,继承自OnlineEmbeddingModuleBase,用于对文档进行相关性重排序。
Parameters:
-
embed_url(str, default:'https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank') –重排序API的基础URL,默认为"https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank"。
-
embed_model_name(str, default:'gte-rerank-v2') –使用的模型名称,默认为"gte-rerank"。
-
api_key(str, default:None) –通义千问的API密钥,如果未提供则从lazyllm.config['qwen_api_key']读取。
-
**kwargs–其他传递给基类的参数。
属性: type: 返回模型类型,固定为"ONLINE_RERANK"。
主要功能: - 对输入的查询和文档列表进行相关性重排序 - 支持自定义排序参数 - 返回每个文档的索引和相关性得分
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenTTS
Bases: LazyLLMOnlineTTSModuleBase, QwenMultiModal
通义千问的文本转语音模块,继承自QwenMultiModal,提供多种语音合成模型支持。
Parameters:
-
model(str, default:None) –模型名称,默认为"qwen-tts"。可选模型包括: - cosyvoice-v2 - cosyvoice-v1 - sambert - qwen-tts - qwen-tts-latest
-
api_key(str, default:None) –API密钥,默认为None,将从lazyllm.config['qwen_api_key']读取。
-
return_trace(bool, default:False) –是否返回调用追踪信息,默认为False。
-
**kwargs–其他传递给基类的参数。
语音合成参数:
input (str): 要转换的文本内容。
voice (str): 说话人声音,默认使用模型默认声音。
speech_rate (float): 语速,默认为1.0。
volume (int): 音量,默认为50。
pitch (float): 音高,默认为1.0。
注意: - 不同的模型可能支持不同的声音选项 - 返回的音频数据会被自动编码为文件格式
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
lazyllm.module.llms.onlinemodule.supplier.sensenova.SenseNovaChat
Bases: OnlineChatModuleBase, FileHandlerBase, _SenseNovaBase
SenseNovaChat是商汤科技开放平台的LLM接口管理组件,继承自OnlineChatModuleBase和FileHandlerBase,具备对话和文件处理能力。
Parameters:
-
base_url(str, default:'https://api.sensenova.cn/compatible-mode/v1/') –API的基础URL,默认为"https://api.sensenova.cn/compatible-mode/v1/"。
-
model(str, default:'SenseChat-5') –使用的模型名称,默认为"SenseChat-5"。
-
api_key(str, default:None) –商汤API密钥,如果未提供则从lazyllm.config['sensenova_api_key']读取。
-
secret_key(str, default:None) –商汤密钥,如果未提供则从lazyllm.config['sensenova_secret_key']读取。
-
stream(bool, default:True) –是否启用流式输出,默认为True。
-
return_trace(bool, default:False) –是否返回调用链跟踪信息,默认为False。
-
**kwargs–其他传递给基类的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/sensenova.py
59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 | |
set_deploy_parameters(**kw)
lazyllm.module.llms.onlinemodule.base.onlineMultiModalBase.OnlineMultiModalBase
Bases: LazyLLMOnlineBase, LLMBase
多模态在线模型的基类,继承自LLMBase,提供多模态模型的基础功能实现。
Parameters:
-
model_name(str) –模型名称,默认为None。如果未指定会产生警告。
-
return_trace(bool, default:False) –是否返回调用追踪信息,默认为False。
-
**kwargs–其他传递给基类的参数。
属性:
series: 返回模型系列名称。
type: 返回模型类型,固定为"MultiModal"。
主要方法:
share(): 创建模块的共享实例。
forward(input, lazyllm_files, **kwargs): 处理输入和文件的主要方法。
_forward(input, files, **kwargs): 需要被子类实现的具体前向处理方法。
注意: - 子类必须实现_forward方法。 - 如果未指定模型名称(model_name),系统会产生警告日志。
Source code in lazyllm/module/llms/onlinemodule/base/onlineMultiModalBase.py
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 | |
lazyllm.module.llms.onlinemodule.base.utils.LazyLLMOnlineBase
Bases: ModuleBase
LazyLLM 在线模块基类,继承自 ModuleBase,并使用 LazyLLMRegisterMetaClass, 为所有在线服务模块提供统一的基础功能。
该类封装了在线模块的通用行为,包括缓存机制和调试追踪功能,是构建各种在线API服务模块的基础类。
功能特性
- 继承 ModuleBase 的所有基础功能,包括子模块管理、钩子注册等。
- 支持在线模块缓存机制,可通过配置控制是否启用缓存。
- 提供调试追踪功能,便于问题排查和性能分析。
- 作为所有在线服务模块(如聊天、嵌入、多模态等)的公共基类。
Parameters:
-
return_trace(bool, default:False) –是否将推理结果写入 trace 队列,用于调试和追踪。默认为
False。
使用场景
- 作为在线聊天模块(OnlineChatModuleBase)的基类。
- 作为在线嵌入模块(OnlineEmbeddingModuleBase)的基类。
- 作为在线多模态模块(OnlineMultiModalBase)的基类。
- 为自定义在线服务模块提供统一的基础功能。
Source code in lazyllm/module/llms/onlinemodule/base/utils.py
lazyllm.module.module.ModuleCache
Bases: object
模块缓存管理器,提供统一的缓存存储和检索功能。
该类封装了多种缓存策略(内存、文件、SQLite、Redis),支持根据配置自动选择缓存存储方式,为模块执行结果提供高效的缓存机制。
功能特性
- 支持多种缓存策略:内存缓存、文件缓存、SQLite数据库缓存、Redis缓存。
- 自动根据配置选择缓存策略,默认为内存缓存。
- 支持缓存模式控制(读写、只读、只写、禁用)。
- 提供统一的缓存接口,隐藏底层存储实现细节。
- 支持参数哈希化,确保缓存键的唯一性。
Parameters:
-
strategy(Optional[str], default:None) –缓存策略,可选值为 'memory'、'file'、'sqlite'、'redis'。默认为 None,将使用配置中的策略。
使用场景
- 为模块执行结果提供缓存,避免重复计算。
- 在分布式环境中使用 Redis 缓存实现共享。
- 使用文件或数据库缓存实现持久化存储。
- 根据性能需求选择不同的缓存策略。
Source code in lazyllm/module/module.py
191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 | |
close()
关闭缓存存储策略。
释放缓存存储策略占用的资源,如关闭数据库连接、清理内存缓存等。调用此方法后,缓存将不再可用。
注意:
- 调用此方法后,缓存实例将无法继续使用。
- 不同的缓存策略可能有不同的资源清理行为。
get(key, args, kw)
从缓存中获取数据。
根据提供的键和参数从缓存中检索数据。如果缓存模式不允许读取或数据不存在,将抛出异常。
Parameters:
-
key–缓存键,用于标识缓存数据。
-
args–位置参数,用于生成缓存哈希键。
-
kw–关键字参数,用于生成缓存哈希键。
Returns:
- 任意类型:缓存中存储的数据。
异常:
- CacheNotFoundError: 当缓存中不存在指定数据时抛出。
- RuntimeError: 当缓存模式设置为只写(WO)时抛出。
Source code in lazyllm/module/module.py
set(key, args, kw, value)
将数据存储到缓存中。
根据提供的键和参数将数据存储到缓存中。如果缓存模式不允许写入,则直接返回不执行存储操作。
Parameters:
-
key–缓存键,用于标识缓存数据。
-
args–位置参数,用于生成缓存哈希键。
-
kw–关键字参数,用于生成缓存哈希键。
-
value–要存储的数据。
注意:
- 如果缓存模式设置为只读(RO)或禁用(NONE),此方法将直接返回而不执行存储操作。
Source code in lazyllm/module/module.py
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenChat
Bases: OnlineChatModuleBase, FileHandlerBase
TODO: The Qianwen model has been finetuned and deployed successfully,
but it is not compatible with the OpenAI interface and can only
be accessed through the Dashscope SDK.
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 | |
set_deploy_parameters(**kw)
设置模型部署参数。
配置部署任务的相关参数,如容量规格等,用于后续模型部署。
Parameters:
-
**kw–部署参数键值对。
lazyllm.module.llms.onlinemodule.supplier.qwen.QwenEmbed
Bases: LazyLLMOnlineEmbedModuleBase
通义千问在线文本嵌入模块。
该类继承自OnlineEmbeddingModuleBase,提供了与通义千问文本嵌入API的交互能力,支持将文本转换为向量表示。
Parameters:
-
embed_url(str, default:'https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding') –嵌入API的URL地址。默认为通义千问官方API地址
-
embed_model_name(str, default:'text-embedding-v1') –嵌入模型名称。默认为 'text-embedding-v1'
-
api_key(str, default:None) –API密钥。默认为从配置中获取的 'qwen_api_key'
Source code in lazyllm/module/llms/onlinemodule/supplier/qwen.py
lazyllm.module.llms.onlinemodule.supplier.glm.GLMEmbed
Bases: LazyLLMOnlineEmbedModuleBase
GLM嵌入模型接口类,用于调用智谱AI的文本嵌入服务。
Parameters:
-
embed_url(str, default:'https://open.bigmodel.cn/api/paas/v4/embeddings') –嵌入服务API地址,默认为"https://open.bigmodel.cn/api/paas/v4/embeddings"
-
embed_model_name(str, default:'embedding-2') –嵌入模型名称,默认为"embedding-2"
-
api_key(str, default:None) –API密钥
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
lazyllm.module.llms.onlinemodule.supplier.glm.GLMSTT
Bases: LazyLLMOnlineSTTModuleBase, GLMMultiModal
GLM语音识别模块,继承自GLMMultiModal。
提供基于智谱AI的语音转文本(STT)功能,支持音频文件的语音识别。
Parameters:
-
model_name(str, default:None) –模型名称,默认为配置中的模型名或"glm-asr"
-
api_key(str, default:None) –API密钥,默认为配置中的密钥
-
return_trace(bool, default:False) –是否返回追踪信息,默认为False
-
**kwargs–其他模型参数
Source code in lazyllm/module/llms/onlinemodule/supplier/glm.py
lazyllm.module.llms.onlinemodule.supplier.deepseek.DeepSeekChat
Bases: OnlineChatModuleBase
DeepSeek大语言模型接口模块。
Parameters:
-
base_url(str, default:'https://api.deepseek.com') –API基础URL,默认为"https://api.deepseek.com"
-
model(str, default:'deepseek-chat') –模型名称,默认为"deepseek-chat"
-
api_key(str, default:None) –API密钥,如果为None则从配置中获取
-
stream(bool, default:True) –启用流式输出,默认为True
-
return_trace(bool, default:False) –返回追踪信息,默认为False
-
**kwargs–其他传递给基类的参数
Source code in lazyllm/module/llms/onlinemodule/supplier/deepseek.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoText2Image
Bases: LazyLLMOnlineText2ImageModuleBase, DoubaoMultiModal
字节跳动豆包文生图模块,支持纯文本生成图像和图像编辑模型。
基于字节跳动豆包多模态模型的文生图、图像编辑功能,继承自DoubaoMultiModal, 提供高质量的文本到图像生成能力。
Parameters:
-
api_key(str, default:None) –豆包API密钥,默认为None。
-
model_name(str) –模型名称,默认为"doubao-seedream-3-0-t2i-250415"。
-
return_trace(bool, default:False) –是否返回追踪信息,默认为False。
-
**kwargs–其他传递给父类的参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.llms.onlinemodule.supplier.openai.OpenAIChat
Bases: OnlineChatModuleBase, FileHandlerBase
OpenAI API集成模块,用于聊天完成和微调操作。
提供与OpenAI聊天模型交互的接口,支持推理和微调功能。继承自OnlineChatModuleBase和FileHandlerBase。
Parameters:
-
base_url(str, default:'https://api.openai.com/v1/') –OpenAI API基础URL,默认为"https://api.openai.com/v1/"。
-
model(str, default:'gpt-3.5-turbo') –用于聊天完成的模型名称,默认为"gpt-3.5-turbo"。
-
api_key(str, default:None) –OpenAI API密钥,默认为lazyllm.config['openai_api_key']。
-
stream(bool, default:True) –使用流式响应,默认为True。
-
return_trace(bool, default:False) –返回追踪信息,默认为False。
-
**kwargs–传递给OnlineChatModuleBase的额外参数。
Source code in lazyllm/module/llms/onlinemodule/supplier/openai.py
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 | |
lazyllm.module.llms.onlinemodule.supplier.openai.OpenAIRerank
Bases: LazyLLMOnlineRerankModuleBase
OpenAIRerank 类用于调用 OpenAI 的 Reranking 接口,对文本列表进行重排序(Re-ranking)。
该类继承自 OnlineEmbeddingModuleBase,主要功能包括:
- 设置嵌入(Embedding)模型的 URL 和名称;
- 封装请求数据并调用 OpenAI Rerank API;
- 解析返回的排序结果。
Parameters:
-
embed_url(str, default:'https://api.openai.com/v1/') –OpenAI API 的基础 URL,默认值为 'https://api.openai.com/v1/'。
-
embed_model_name(str, default:'rerank-multilingual-v3.0') –嵌入模型名称,用于指定 Rerank 模型。
-
api_key(str, default:None) –OpenAI API Key,可选,如果未提供,则使用 lazyllm 配置中的默认值。
-
**kw–其他可选关键字参数,传递给父类构造函数。
Source code in lazyllm/module/llms/onlinemodule/supplier/openai.py
lazyllm.module.llms.onlinemodule.supplier.sensenova.SenseNovaEmbed
Bases: LazyLLMOnlineEmbedModuleBase, _SenseNovaBase
商汤科技SenseNova嵌入模型模块,用于文本向量化操作。提供与商汤科技SenseNova嵌入模型交互的接口,支持文本到向量的转换功能。继承自OnlineEmbeddingModuleBase和_SenseNovaBase。
Parameters:
-
embed_url(str, default:'https://api.sensenova.cn/v1/llm/embeddings') –嵌入API的URL地址,默认为"https://api.sensenova.cn/v1/llm/embeddings"。
-
embed_model_name(str, default:'nova-embedding-stable') –嵌入模型名称,默认为"nova-embedding-stable"。
-
api_key(str, default:None) –API访问密钥,默认为None。
-
secret_key(str, default:None) –API秘密密钥,默认为None。
Source code in lazyllm/module/llms/onlinemodule/supplier/sensenova.py
lazyllm.module.llms.onlinemodule.supplier.siliconflow.SiliconFlowTTS
Bases: LazyLLMOnlineTTSModuleBase
SiliconFlow文本转语音模块,继承自OnlineMultiModalBase。
提供基于SiliconFlow的文本转语音(TTS)功能,支持将文本转换为音频文件。
Parameters:
-
api_key(str, default:None) –API密钥,默认为配置中的siliconflow_api_key
-
model_name(str, default:None) –模型名称,默认为"fnlp/MOSS-TTSD-v0.5"
-
base_url(str, default:'https://api.siliconflow.cn/v1/') –API基础URL,默认为"https://api.siliconflow.cn/v1/"
-
return_trace(bool, default:False) –是否返回追踪信息,默认为False
-
**kwargs–其他模型参数
Source code in lazyllm/module/llms/onlinemodule/supplier/siliconflow.py
lazyllm.module.llms.onlinemodule.supplier.siliconflow.SiliconFlowChat
Bases: OnlineChatModuleBase, FileHandlerBase
SiliconFlow 模块,继承自 OnlineChatModuleBase 和 FileHandlerBase。
提供基于 SiliconFlow 平台的大语言模型对话能力,支持多种模型(包括视觉语言模型),并具备文件处理功能。
Parameters:
-
base_url(str, default:'https://api.siliconflow.cn/v1/') –API 基础地址,默认为 "https://api.siliconflow.cn/v1/"
-
model(str, default:'Qwen/QwQ-32B') –使用的模型名称,默认为 "Qwen/QwQ-32B"
-
api_key(str, default:None) –API 密钥,默认从配置项 lazyllm.config['siliconflow_api_key'] 中读取
-
stream(bool, default:True) –是否启用流式输出,默认为 True
-
return_trace(bool, default:False) –是否返回追踪信息,默认为 False
-
**kwargs–其他模型参数
Source code in lazyllm/module/llms/onlinemodule/supplier/siliconflow.py
lazyllm.module.llms.onlinemodule.supplier.siliconflow.SiliconFlowRerank
Bases: LazyLLMOnlineRerankModuleBase
SiliconFlow 重排序模块,继承自 OnlineEmbeddingModuleBase。
提供基于 SiliconFlow 平台的文本重排序(Reranking)功能,用于对文档列表根据查询相关性进行重新排序。
Parameters:
-
embed_url(str, default:'https://api.siliconflow.cn/v1/rerank') –重排序 API 的 URL,默认为 "https://api.siliconflow.cn/v1/rerank"
-
embed_model_name(str, default:'BAAI/bge-reranker-v2-m3') –使用的重排序模型名称,默认为 "BAAI/bge-reranker-v2-m3"
-
api_key(str, default:None) –API 密钥,默认从配置项 lazyllm.config['siliconflow_api_key'] 中读取
-
**kw–其他重排序模块参数
Returns:
-
–
List[Tuple]: 包含排序结果的列表,每个元素为包含 'index'、'relevance_score' 的元组。
Source code in lazyllm/module/llms/onlinemodule/supplier/siliconflow.py
lazyllm.module.llms.onlinemodule.supplier.siliconflow.SiliconFlowText2Image
Bases: LazyLLMOnlineText2ImageModuleBase
SiliconFlow文生图模块,继承自OnlineMultiModalBase。
提供基于SiliconFlow的文本生成图像功能,支持根据文本描述生成图像,支持纯文本生成图像和图像编辑。
Parameters:
-
api_key(str, default:None) –API密钥,默认为配置中的siliconflow_api_key
-
model_name(str) –模型名称,默认为"Qwen/Qwen-Image"
-
base_url(str) –API基础URL,默认为"https://api.siliconflow.cn/v1/"
-
return_trace(bool, default:False) –是否返回追踪信息,默认为False
-
**kwargs–其他模型参数
Source code in lazyllm/module/llms/onlinemodule/supplier/siliconflow.py
lazyllm.module.llms.onlinemodule.supplier.aiping.AipingChat
Bases: OnlineChatModuleBase, FileHandlerBase
AipingChat 是 AIPing 的在线聊天模块,继承自 OnlineChatModuleBase 和 FileHandlerBase。
提供与 AIPing 平台大语言模型交互的接口,支持对话生成、文件处理以及模型微调等功能。支持多种模型,包括视觉语言模型(VLM)如 Qwen2.5-VL、Qwen3-VL、GLM-4.5V、GLM-4.6V 等。
Parameters:
-
base_url(str, default:'https://aiping.cn/api/v1/') –API 基础 URL,默认为 "https://aiping.cn/api/v1/"。
-
model(str, default:'DeepSeek-R1') –使用的模型名称,默认为 "DeepSeek-R1"。
-
api_key(Optional[str], default:None) –访问 AIPing 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
stream(bool, default:True) –是否开启流式输出,默认为 True。
-
return_trace(bool, default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给 OnlineChatModuleBase 的参数。
功能特点
- 支持多种大语言模型,包括通用对话模型和视觉语言模型
- 支持流式输出,提升用户体验
- 集成文件处理功能,支持微调数据格式验证和转换
- 内置系统提示:"You are an intelligent assistant developed by AIPing. You are a helpful assistant."
- 支持 API Key 验证,确保服务安全性
Source code in lazyllm/module/llms/onlinemodule/supplier/aiping.py
lazyllm.module.llms.onlinemodule.supplier.aiping.AipingEmbed
Bases: LazyLLMOnlineEmbedModuleBase
AIPing 文本嵌入模块,继承自 OnlineEmbeddingModuleBase。
提供与 AIPing 文本嵌入服务交互的接口,支持将文本转换为向量表示,支持批量处理。
Parameters:
-
embed_url(str, default:'https://aiping.cn/api/v1/embeddings') –嵌入 API 的 URL,默认为 "https://aiping.cn/api/v1/embeddings"。
-
embed_model_name(str, default:'text-embedding-v1') –使用的嵌入模型名称,默认为 "text-embedding-v1"。
-
api_key(Optional[str], default:None) –访问 AIPing 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
batch_size(int, default:16) –批处理大小,默认为 16。
-
**kw–其他传递给基类的参数。
功能特点
- 将文本转换为高维向量表示
- 支持批量文本处理,提高效率
- 可配置的批处理大小,适应不同性能需求
- 与 AIPing API 无缝集成
Source code in lazyllm/module/llms/onlinemodule/supplier/aiping.py
lazyllm.module.llms.onlinemodule.supplier.aiping.AipingRerank
Bases: LazyLLMOnlineRerankModuleBase
AIPing 重排序模块,继承自 OnlineEmbeddingModuleBase。
提供与 AIPing 重排序服务交互的接口,用于对文档列表根据查询相关性进行重新排序。该模块返回一个包含文档索引和相关性得分的元组列表。
Parameters:
-
embed_url(str, default:'https://aiping.cn/api/v1/rerank') –重排序 API 的 URL,默认为 "https://aiping.cn/api/v1/rerank"。
-
embed_model_name(str, default:'Qwen3-Reranker-0.6B') –使用的重排序模型名称,默认为 "Qwen3-Reranker-0.6B"。
-
api_key(Optional[str], default:None) –访问 AIPing 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
**kw–其他传递给基类的参数。
属性
type (str): 返回模型类型,固定为 "RERANK"。
功能特点
- 根据查询对文档列表进行相关性重排序
- 支持自定义排序参数(top_n 等)
- 返回每个文档的索引和相关性得分
- 适用于搜索结果优化和文档推荐场景
Source code in lazyllm/module/llms/onlinemodule/supplier/aiping.py
lazyllm.module.llms.onlinemodule.supplier.aiping.AipingText2Image
Bases: LazyLLMOnlineText2ImageModuleBase
AIPing 文本生成图像模块,继承自 OnlineMultiModalBase。
提供与 AIPing 图像生成服务交互的接口,支持根据文本描述生成图像。支持负面提示、图像数量、尺寸和随机种子等参数。
Parameters:
-
api_key(Optional[str], default:None) –访问 AIPing 服务的 API Key,若未提供则从 lazyllm 配置中读取。
-
model_name(str, default:'Qwen-Image') –使用的模型名称,默认为 "Qwen-Image"。
-
base_url(str, default:'https://aiping.cn/api/v1/') –API 基础 URL,默认为 "https://aiping.cn/api/v1/"。
-
return_trace(bool, default:False) –是否返回调试追踪信息,默认为 False。
-
**kwargs–其他传递给基类的参数。
功能特点
- 根据文本提示生成高质量图像
- 支持负面提示,过滤不想要的图像特征
- 可配置生成图像的数量(n 参数)
- 支持多种图像尺寸规格
- 支持随机种子控制,确保结果可重现
- 自动下载生成的图像并编码为文件格式
- 默认负面提示:"模糊,低质量"
注意
- 该模块会自动下载生成的图像到本地文件
- 返回结果会包含文件路径信息,便于后续处理
Source code in lazyllm/module/llms/onlinemodule/supplier/aiping.py
138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 | |