模块
lazyllm.module.ModuleBase
Module是LazyLLM中的顶层组件,具备训练、部署、推理和评测四项关键能力,每个模块可以选择实现其中的部分或者全部的能力,每项能力都可以由一到多个Component组成。
ModuleBase本身不可以直接实例化,继承并实现 forward 函数的子类可以作为一个仿函数来使用。
类似pytorch的Moudule,当一个Module A持有了另一个Module B的实例作为成员变量时,会自动加入到submodule中。
如果你需要以下的能力,请让你自定义的类继承自ModuleBase:
-
组合训练、部署、推理和评测的部分或全部能力,例如Embedding模型需要训练和推理
-
持有的成员变量具备训练、部署和评测的部分或全部能力,并且想通过Module的根节点的
start,update,eval等方法对其持有的成员进行训练、部署和评测时。 -
将用户设置的参数从最外层直接传到你自定义的模块中(参考Tools.webpages.WebModule)
-
希望能被参数网格搜索模块使用(参考TrialModule)
Examples:
>>> import lazyllm
>>> class Module(lazyllm.module.ModuleBase):
... pass
...
>>> class Module2(lazyllm.module.ModuleBase):
... def __init__(self):
... super(__class__, self).__init__()
... self.m = Module()
...
>>> m = Module2()
>>> m.submodules
[<Module type=Module>]
>>> m.m3 = Module()
>>> m.submodules
[<Module type=Module>, <Module type=Module>]
Source code in lazyllm/module/module.py
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 | |
_get_deploy_tasks()
定义部署任务,该函数返回训练的pipeline,重写了此函数的子类可以在update/start阶段被部署。
Examples:
>>> import lazyllm
>>> class MyModule(lazyllm.module.ModuleBase):
... def _get_deploy_tasks(self):
... return lazyllm.pipeline(lambda : 1, lambda x: print(x))
...
>>> MyModule().start()
1
Source code in lazyllm/module/module.py
_get_train_tasks()
eval(*, recursive=True)
对模块(及所有的子模块)进行评测。当模块通过 evalset 设置了评测集之后,本函数生效。
Parameters:
-
recursive(bool, default:True) –是否递归评测所有的子模块,默认为True
Examples:
>>> import lazyllm
>>> class MyModule(lazyllm.module.ModuleBase):
... def forward(self, input):
... return f'reply for input'
...
>>> m = MyModule()
>>> m.evalset([1, 2, 3])
>>> m.eval().eval_result
['reply for input', 'reply for input', 'reply for input']
Source code in lazyllm/module/module.py
evalset(evalset, load_f=None, collect_f=lambda x: x)
为Module设置评测集,设置过评测集的Module在 update 或 eval 的时候会进行评测,评测结果会存在eval_result变量中。
Examples:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(lazyllm.deploy.dummy).finetune_method(lazyllm.finetune.dummy).trainset("").mode("finetune").prompt(None)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> print(m.eval_result)
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
Source code in lazyllm/module/module.py
forward(*args, **kw)
start()
部署模块及所有的子模块
Examples:
>>> import lazyllm
>>> m = lazyllm.TrainableModule().deploy_method(lazyllm.deploy.dummy).prompt(None)
>>> m.start()
<Module type=Trainable mode=None basemodel= target= stream=False return_trace=False>
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/module.py
restart()
重新重启模块及所有的子模块
Examples:
>>> import lazyllm
>>> m = lazyllm.TrainableModule().deploy_method(lazyllm.deploy.dummy).prompt(None)
>>> m.restart()
<Module type=Trainable mode=None basemodel= target= stream=False return_trace=False>
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/module.py
update(*, recursive=True)
更新模块(及所有的子模块)。当模块重写了 _get_train_tasks 方法后,模块会被更新。更新完后会自动进入部署和推理的流程。
Parameters:
-
recursive(bool, default:True) –是否递归更新所有的子模块,默认为True
Examples:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(lazyllm.finetune.dummy).trainset("").deploy_method(lazyllm.deploy.dummy).mode('finetune').prompt(None)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> print(m.eval_result)
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
Source code in lazyllm/module/module.py
lazyllm.module.servermodule.LLMBase
Bases: ModuleBase
大语言模型模块的基类,继承自 ModuleBase。
负责管理流式输出、Prompt 和格式化器的初始化与切换,处理输入中的文件信息,支持实例共享。
Parameters:
-
stream(bool 或 dict, default:False) –是否启用流式输出或流式配置,默认为 False。
-
return_trace(bool, default:False) –是否返回执行过程的 trace,默认为 False。
-
init_prompt(bool, default:True) –是否在初始化时自动创建默认 Prompt,默认为 True。
Source code in lazyllm/module/servermodule.py
22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 | |
prompt(prompt=None, history=None)
设置或切换 Prompt。支持 None、PrompterBase 子类或字符串/字典类型创建 ChatPrompter。
Parameters:
-
prompt(str / dict / PrompterBase / None, default:None) –要设置的 Prompt。
-
history(list, default:None) –对话历史,仅当 prompt 为字符串或字典时有效。
Returns
- self: 便于链式调用。
Source code in lazyllm/module/servermodule.py
formatter(format=None)
设置或切换输出格式化器。支持 None、FormatterBase 子类或可调用对象。
Parameters:
-
format(FormatterBase / Callable / None, default:None) –格式化器对象或函数,默认为 None。
Returns
- self: 便于链式调用。
Source code in lazyllm/module/servermodule.py
share(prompt=None, format=None, stream=None, history=None)
创建当前实例的浅拷贝,并可重新设置 prompt、formatter、stream 等属性。
适用于多会话或多 Agent 共享基础配置但个性化部分参数的场景。
Parameters:
-
prompt(str / dict / PrompterBase / None, default:None) –新的 Prompt,可选。
-
format(FormatterBase / None, default:None) –新的格式化器,可选。
-
stream(bool / dict / None, default:None) –新的流式设置,可选。
-
history(list / None, default:None) –新的对话历史,仅在设置 Prompt 时有效。
Returns
- LLMBase: 新的共享实例。
Source code in lazyllm/module/servermodule.py
lazyllm.module.ActionModule
Bases: ModuleBase
用于将函数、模块、flow、Module等可调用的对象包装一个Module。被包装的Module(包括flow中的Module)都会变成该Module的submodule。
Parameters:
-
action(Callable | list[Callable], default:()) –被包装的对象,是一个或一组可执行的对象。
-
return_trace(bool, default:False) –是否开启 trace 模式,用于记录调用栈,默认为
False。
Source code in lazyllm/module/module.py
submodules
property
返回被包装 action 中所有属于 ModuleBase 类型的子模块。该属性会自动展开 Pipeline 中嵌套的模块。
Returns:
- list[ModuleBase]: 子模块列表
forward(*args, **kw)
执行被包装的 action,对输入参数进行前向计算。等效于调用该模块本身。
Parameters:
-
args(list of callables or single callable, default:()) –传递给被包装 action 的位置参数。
-
kwargs(dict of callables) –传递给被包装 action 的关键字参数。
Returns:
- 任意类型:被包装 action 的执行结果。
Source code in lazyllm/module/module.py
lazyllm.module.TrainableModule
Bases: UrlModule
可训练模块,所有模型(包括LLM、Embedding等)都通过TrainableModule提供服务
TrainableModule(base_model='', target_path='', *, stream=False, return_trace=False)
Parameters:
-
base_model(str, default:'') –基础模型的名称或路径。
-
target_path(str, default:'') –保存微调任务的路径。
-
source(str) –模型来源,如果未设置,将从环境变量LAZYLLM_MODEL_SOURCE读取。
-
stream(bool, default:False) –输出流式结果。
-
return_trace(bool, default:False) –在trace中记录结果。
TrainableModule.trainset(v):
设置 TrainableModule 的训练集
Parameters:
-
v(str) –训练/微调数据集的路径
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).trainset('/file/to/path').deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
TrainableModule.train_method(v, **kw):
设置 TrainableModule 的训练方法(暂不支持继续预训练,预计下一版本支持)
Parameters:
-
v(LazyLLMTrainBase) –训练方法,可选值包括
train.auto等 -
kw(**dict) –训练方法所需的参数,对应 v 的参数
TrainableModule.finetune_method(v, **kw):
设置 TrainableModule 的微调方法及其参数
Parameters:
-
v(LazyLLMFinetuneBase) –微调方法,可选值包括
finetune.auto/finetune.alpacalora/finetune.collie等 -
kw(**dict) –微调方法所需的参数,对应 v 的参数
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
TrainableModule.deploy_method(v, **kw):
设置 TrainableModule 的部署方法及其参数
Parameters:
-
v(LazyLLMDeployBase) –部署方法,可选值包括
deploy.auto/deploy.lightllm/deploy.vllm等 -
kw(**dict) –部署方法所需的参数,对应 v 的参数
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy).mode('finetune')
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> m.eval_result
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
TrainableModule.mode(v):
设置 TrainableModule 在 update 时执行训练还是微调
Parameters:
-
v(str) –设置在 update 时执行训练还是微调,可选值为 'finetune' 和 'train',默认为 'finetune'
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().finetune_method(finetune.dummy).deploy_method(None).mode('finetune')
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
eval(*, recursive=True)
评估该模块(及其所有子模块)。此功能需在模块通过evalset设置评估集后生效。
Parameters:
-
recursive(bool)) –是否递归评估所有子模块,默认为True。
evalset(evalset, load_f=None, collect_f=<function ModuleBase.<lambda>>)
为模块设置评估集。已设置评估集的模块将在执行update或eval时进行评估,评估结果将存储在eval_result变量中。
evalset(evalset, collect_f=lambda x: ...)→ None
Parameters:
-
evalset(list)) –评估数据集
-
collect_f(Callable)) –评估结果的后处理方法,默认不进行后处理。
evalset(evalset, load_f=None, collect_f=lambda x: ...)→ None
Parameters:
-
evalset(str)) –评估集路径
-
load_f(Callable)) –评估集加载方法,包括文件格式解析和列表转换
-
collect_f(Callable)) –评估结果后处理方法,默认不进行后处理
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.evalset([1, 2, 3])
>>> m.update()
INFO: (lazyllm.launcher) PID: dummy finetune!, and init-args is {}
>>> m.eval_result
["reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1}", "reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1}"]
restart()
重启模块及其所有子模块
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.restart()
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
start()
部署模块及其所有子模块
示例:
>>> import lazyllm
>>> m = lazyllm.module.TrainableModule().deploy_method(deploy.dummy)
>>> m.start()
>>> m(1)
"reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1}"
Source code in lazyllm/module/llms/trainablemodule.py
218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 | |
wait()
stop(task_name=None)
暂停模型特定任务。 Args: task_name(str): 需要暂停的任务名, 默认为None(默认暂停deploy任务)
Examples:
>>> import lazyllm
>>> class Mystop(lazyllm.module.llms.TrainableModule):
... def forward(self, task):
... self.stop(task)
Source code in lazyllm/module/llms/trainablemodule.py
prompt(prompt='', history=None)
处理输入的prompt生成符合模型需求的格式。 Args: prompt(str): 输入的prompt, 默认为空。 history(**List): 对话历史记忆。
Examples:
>>> import lazyllm
>>> class Myprompt(lazyllm.module.llms.TrainableModule):
... def forward(self, prompt, history):
... self.prompt(prompt,history)
Source code in lazyllm/module/llms/trainablemodule.py
forward(__input=package(), *, llm_chat_history=None, lazyllm_files=None, tools=None, stream_output=False, **kw)
自动构建符合模型要求的输入数据结构,适配多模态场景。
Examples:
>>> import lazyllm
>>> from lazyllm.module import TrainableModule
>>> class MyModule(TrainableModule):
... def forward(self, __input, **kw):
... return f"processed: {__input}"
...
>>> MyModule()("Hello")
'processed: Hello'
Source code in lazyllm/module/llms/trainablemodule.py
lazyllm.module.UrlModule
Bases: LLMBase, _UrlHelper
可以将ServerModule部署得到的Url包装成一个Module,调用 __call__ 时会访问该服务。
Parameters:
-
url(str, default:'') –要包装的服务的Url,默认为空字符串
-
stream(bool | Dict[str, str], default:False) –是否流式请求和输出,默认为非流式
-
return_trace(bool, default:False) –是否将结果记录在trace中,默认为False
-
init_prompt(bool, default:True) –是否初始化prompt,默认为True
Examples:
>>> import lazyllm
>>> def demo(input): return input * 2
...
>>> s = lazyllm.ServerModule(demo, launcher=lazyllm.launchers.empty(sync=False))
>>> s.start()
INFO: Uvicorn running on http://0.0.0.0:35485
>>> u = lazyllm.UrlModule(url=s._url)
>>> print(u(1))
2
Source code in lazyllm/module/servermodule.py
156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 | |
lazyllm.module.ServerModule
Bases: UrlModule
借助 fastapi,将任意可调用对象包装成 api 服务,可同时启动一个主服务和多个卫星服务。
Parameters:
-
m(Callable, default:None) –被包装成服务的函数,可以是一个函数,也可以是一个仿函数。当启动卫星服务时,需要是一个实现了
__call__的对象(仿函数)。 -
pre(Callable, default:None) –前处理函数,在服务进程执行,可以是一个函数,也可以是一个仿函数,默认为
None。 -
post(Callable, default:None) –后处理函数,在服务进程执行,可以是一个函数,也可以是一个仿函数,默认为
None。 -
stream(bool, default:False) –是否流式请求和输出,默认为非流式。
-
return_trace(bool, default:False) –是否将结果记录在 trace 中,默认为
False。 -
port(int, default:None) –指定服务部署后的端口,默认为
None会随机生成端口。 -
pythonpath(str)–传递给子进程的 PYTHONPATH 环境变量,默认为
None。 -
launcher(LazyLLMLaunchersBase, default:None) –用于选择服务执行的计算节点,默认为是异步远程部署"launchers.remote(sync=False)"。
-
url(str)–模块服务的地址,默认为"None",使用Redis获取。
Source code in lazyllm/module/servermodule.py
262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 | |
lazyllm.module.AutoModel
用于部署在线 API 模型或本地模型的模块,支持加载在线推理模块或本地可微调模块。
Args:
model (str): 指定要加载的模型名称,例如 internlm2-chat-7b,可为空。为空时默认加载 internlm2-chat-7b。
source (str): 指定要使用的在线模型服务,如需使用在线模型,必须传入此参数。支持 qwen / glm / openai / moonshot 等。
framework (str): 指定本地部署所使用的推理框架,支持 lightllm / vllm / lmdeploy。将通过 TrainableModule 与指定框架组合进行部署。
Source code in lazyllm/module/llms/automodel.py
lazyllm.module.TrialModule
Bases: object
参数网格搜索模块,会遍历其所有的submodule,收集所有的可被搜索的参数,遍历这些参数进行微调、部署和评测
Parameters:
-
m(Callable) –被网格搜索参数的子模块,微调、部署和评测都会基于这个模块进行
Examples:
>>> import lazyllm
>>> from lazyllm import finetune, deploy
>>> m = lazyllm.TrainableModule('b1', 't').finetune_method(finetune.dummy, **dict(a=lazyllm.Option(['f1', 'f2'])))
>>> m.deploy_method(deploy.dummy).mode('finetune').prompt(None)
>>> s = lazyllm.ServerModule(m, post=lambda x, ori: f'post2({x})')
>>> s.evalset([1, 2, 3])
>>> t = lazyllm.TrialModule(s)
>>> t.update()
>>>
dummy finetune!, and init-args is {a: f1}
dummy finetune!, and init-args is {a: f2}
[["post2(reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1})"], ["post2(reply for 1, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 2, and parameters is {'do_sample': False, 'temperature': 0.1})", "post2(reply for 3, and parameters is {'do_sample': False, 'temperature': 0.1})"]]
Source code in lazyllm/module/trialmodule.py
lazyllm.module.OnlineChatModule
用来管理创建目前市面上公开的大模型平台访问模块,目前支持openai、sensenova、glm、kimi、qwen、doubao、deekseek(由于该平台暂时不让充值了,暂时不支持访问)。平台的api key获取方法参见 开始入门
Parameters:
-
model(str) –指定要访问的模型 (注意使用豆包时需用 Model ID 或 Endpoint ID,获取方式详见 获取推理接入点。使用模型前,要先在豆包平台开通对应服务。),默认为
gpt-3.5-turbo(openai)/SenseChat-5(sensenova)/glm-4(glm)/moonshot-v1-8k(kimi)/qwen-plus(qwen)/mistral-7b-instruct-v0.2(doubao) -
source(str) –指定要创建的模块类型,可选为
openai/sensenova/glm/kimi/qwen/doubao/deepseek(暂时不支持访问) -
base_url(str) –指定要访问的平台的基础链接,默认是官方链接
-
system_prompt(str) –指定请求的system prompt,默认是官方给的system prompt
-
stream(bool) –是否流式请求和输出,默认为流式
-
return_trace(bool) –是否将结果记录在trace中,默认为False
Examples:
>>> import lazyllm
>>> from functools import partial
>>> m = lazyllm.OnlineChatModule(source="sensenova", stream=True)
>>> query = "Hello!"
>>> with lazyllm.ThreadPoolExecutor(1) as executor:
... future = executor.submit(partial(m, llm_chat_history=[]), query)
... while True:
... if value := lazyllm.FileSystemQueue().dequeue():
... print(f"output: {''.join(value)}")
... elif future.done():
... break
... print(f"ret: {future.result()}")
...
output: Hello
output: ! How can I assist you today?
ret: Hello! How can I assist you today?
>>> from lazyllm.components.formatter import encode_query_with_filepaths
>>> vlm = lazyllm.OnlineChatModule(source="sensenova", model="SenseChat-Vision")
>>> query = "what is it?"
>>> inputs = encode_query_with_filepaths(query, ["/path/to/your/image"])
>>> print(vlm(inputs))
Source code in lazyllm/module/llms/onlinemodule/chat.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoModule
Bases: OnlineChatModuleBase
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.OnlineEmbeddingModule
用来管理创建目前市面上的在线Embedding服务模块,目前支持openai、sensenova、glm、qwen、doubao
Parameters:
-
source(str) –指定要创建的模块类型,可选为
openai/sensenova/glm/qwen/doubao -
embed_url(str) –指定要访问的平台的基础链接,默认是官方链接
-
embed_mode_name(str) –指定要访问的模型 (注意使用豆包时需用 Model ID 或 Endpoint ID,获取方式详见 获取推理接入点。使用模型前,要先在豆包平台开通对应服务。),默认为
text-embedding-ada-002(openai)/nova-embedding-stable(sensenova)/embedding-2(glm)/text-embedding-v1(qwen)/doubao-embedding-text-240715(doubao)
Examples:
>>> import lazyllm
>>> m = lazyllm.OnlineEmbeddingModule(source="sensenova")
>>> emb = m("hello world")
>>> print(f"emb: {emb}")
emb: [0.0010528564, 0.0063285828, 0.0049476624, -0.012008667, ..., -0.009124756, 0.0032043457, -0.051696777]
Source code in lazyllm/module/llms/onlinemodule/embedding.py
lazyllm.module.llms.onlinemodule.supplier.openai.OpenAIEmbedding
Bases: OnlineEmbeddingModuleBase
OpenAI 在线嵌入模块。
该类封装了对 OpenAI 嵌入 API 的调用,默认使用模型 text-embedding-ada-002,用于将文本编码为向量表示。
Args:
embed_url (str): OpenAI 嵌入 API 的 URL,默认为 "https://api.openai.com/v1/embeddings"。
embed_model_name (str): 使用的嵌入模型名称,默认为 "text-embedding-ada-002"。
api_key (str, optional): OpenAI 的 API Key。若未提供,则从 lazyllm.config 中读取。
Source code in lazyllm/module/llms/onlinemodule/supplier/openai.py
lazyllm.module.OnlineChatModuleBase
Bases: LLMBase
OnlineChatModuleBase是管理开放平台的LLM接口的公共组件,具备训练、部署、推理等关键能力。OnlineChatModuleBase本身不支持直接实例化, 需要子类继承该类,并实现微调相关的上传文件、创建微调任务、查询微调任务以及和部署相关的创建部署服务、查询部署任务等接口。
如果你需要支持新的开放平台的LLM的能力,请让你自定义的类继承自OnlineChatModuleBase:
1、根据新平台的模型返回参数情况考虑对返回结果进行后处理,如果模型返回的格式和openai一致,可以不用做任何处理
2、如果新平台支持模型的微调,也需要继承FileHandlerBase类,该类主要是验证文件格式,并在自定义类中把.jsonl格式数据转换为模型支持的数据才能用于后面的模型训练
3、如果新平台支持模型的微调,则需要实现文件上传、创建微调服务、查询微调服务的接口。即使新平台不用对微调后的模型进行部署,也请实现一个假的创建部署服务和查询部署服务的接口即可
4、如果新平台支持模型的微调,可以提供一个支持微调的模型列表,有助于在微调服务时进行判断
5、配置新平台支持的api_key到全局变量,通过lazyllm.config.add(变量名,类型,默认值,环境变量名)进行添加
Examples:
>>> import lazyllm
>>> from lazyllm.module import OnlineChatModuleBase
>>> from lazyllm.module.onlineChatModule.fileHandler import FileHandlerBase
>>> class NewPlatformChatModule(OnlineChatModuleBase):
... def __init__(self,
... base_url: str = "<new platform base url>",
... model: str = "<new platform model name>",
... system_prompt: str = "<new platform system prompt>",
... stream: bool = True,
... return_trace: bool = False):
... super().__init__(model_type="new_class_name",
... api_key=lazyllm.config['new_platform_api_key'],
... base_url=base_url,
... system_prompt=system_prompt,
... stream=stream,
... return_trace=return_trace)
...
>>> class NewPlatformChatModule1(OnlineChatModuleBase, FileHandlerBase):
... TRAINABLE_MODELS_LIST = ['model_t1', 'model_t2', 'model_t3']
... def __init__(self,
... base_url: str = "<new platform base url>",
... model: str = "<new platform model name>",
... system_prompt: str = "<new platform system prompt>",
... stream: bool = True,
... return_trace: bool = False):
... OnlineChatModuleBase.__init__(self,
... model_type="new_class_name",
... api_key=lazyllm.config['new_platform_api_key'],
... base_url=base_url,
... system_prompt=system_prompt,
... stream=stream,
... trainable_models=NewPlatformChatModule1.TRAINABLE_MODELS_LIST,
... return_trace=return_trace)
... FileHandlerBase.__init__(self)
...
... def _convert_file_format(self, filepath:str) -> str:
... pass
... return data_str
...
... def _upload_train_file(self, train_file):
... pass
... return train_file_id
...
... def _create_finetuning_job(self, train_model, train_file_id, **kw):
... pass
... return fine_tuning_job_id, status
...
... def _query_finetuning_job(self, fine_tuning_job_id):
... pass
... return fine_tuned_model, status
...
... def _create_deployment(self):
... pass
... return self._model_name, "RUNNING"
...
... def _query_deployment(self, deployment_id):
... pass
... return "RUNNING"
...
Source code in lazyllm/module/llms/onlinemodule/base/onlineChatModuleBase.py
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 | |
lazyllm.module.OnlineEmbeddingModuleBase
Bases: ModuleBase
OnlineEmbeddingModuleBase是管理开放平台的嵌入模型接口的基类,用于请求文本获取嵌入向量。不建议直接对该类进行直接实例化。需要特定平台类继承该类进行实例化。
如果你需要支持新的开放平台的嵌入模型的能力,请让你自定义的类继承自OnlineEmbeddingModuleBase:
1、如果新平台的嵌入模型的请求和返回数据格式都和openai一样,可以不用做任何处理,只传url和模型即可
2、如果新平台的嵌入模型的请求或者返回的数据格式和openai不一样,需要重写_encapsulated_data或_parse_response方法。
3、配置新平台支持的api_key到全局变量,通过lazyllm.config.add(变量名,类型,默认值,环境变量名)进行添加
Examples:
>>> import lazyllm
>>> from lazyllm.module import OnlineEmbeddingModuleBase
>>> class NewPlatformEmbeddingModule(OnlineEmbeddingModuleBase):
... def __init__(self,
... embed_url: str = '<new platform embedding url>',
... embed_model_name: str = '<new platform embedding model name>'):
... super().__init__(embed_url, lazyllm.config['new_platform_api_key'], embed_model_name)
...
>>> class NewPlatformEmbeddingModule1(OnlineEmbeddingModuleBase):
... def __init__(self,
... embed_url: str = '<new platform embedding url>',
... embed_model_name: str = '<new platform embedding model name>'):
... super().__init__(embed_url, lazyllm.config['new_platform_api_key'], embed_model_name)
...
... def _encapsulated_data(self, text:str, **kwargs):
... pass
... return json_data
...
... def _parse_response(self, response: dict[str, any]):
... pass
... return embedding
Source code in lazyllm/module/llms/onlinemodule/base/onlineEmbeddingModuleBase.py
lazyllm.module.llms.onlinemodule.supplier.doubao.DoubaoEmbedding
Bases: OnlineEmbeddingModuleBase
Source code in lazyllm/module/llms/onlinemodule/supplier/doubao.py
lazyllm.module.llms.onlinemodule.fileHandler.FileHandlerBase
FileHandlerBase是用于处理微调数据文件的基类,主要用于验证和转换微调数据格式。该类本身不支持直接实例化,需要子类继承该类并实现特定的文件格式转换逻辑。
FileHandlerBase提供以下功能:
-
验证微调数据文件的格式是否符合标准(.jsonl格式)
-
检查数据内容是否符合预期的消息格式(包含role和content字段)
-
验证角色类型是否在允许的范围内(system、knowledge、user、assistant)
-
确保每个对话示例都包含assistant回复
-
提供临时文件存储机制用于后续处理
Examples:
>>> import lazyllm
>>> from lazyllm.module.llms.onlinemodule.fileHandler import FileHandlerBase
>>> import tempfile
>>> import json
>>> sample_data = [
... {"messages": [{"role": "user", "content": "Hello"}, {"role": "assistant", "content": "Hi there!"}]},
... {"messages": [{"role": "user", "content": "How are you?"}, {"role": "assistant", "content": "I'm doing well, thank you!"}]}
... ]
>>> with tempfile.NamedTemporaryFile(mode='w', suffix='.jsonl', delete=False) as f:
... for item in sample_data:
... f.write(json.dumps(item, ensure_ascii=False) + '
')
... temp_file_path = f.name
>>> class CustomFileHandler(FileHandlerBase):
... def _convert_file_format(self, filepath: str) -> str:
... with open(filepath, 'r', encoding='utf-8') as f:
... data = [json.loads(line) for line in f]
... converted_data = []
... for item in data:
... messages = item.get('messages', [])
... conversation = []
... for msg in messages:
... conversation.append(f"{msg['role']}: {msg['content']}")
... converted_data.append('
'.join(conversation))
... return '
---
'.join(converted_data)
>>> handler = CustomFileHandler()
>>> try:
... result = handler.get_finetune_data(temp_file_path)
... print("数据验证和转换成功")
... except Exception as e:
... print(f"错误: {e}")
... finally:
... import os
... os.unlink(temp_file_path)
Source code in lazyllm/module/llms/onlinemodule/fileHandler.py
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 | |
get_finetune_data(filepath)
获取并处理微调数据文件,包括验证文件格式和转换为目标平台支持的格式。
Parameters:
-
filepath(str) –微调数据文件的路径,必须是.jsonl格式