작업 사용하기

작업 쿼리

프로그래밍 방식으로 작업 요약 목록을 가져오려면 get_job_summaries() 를 사용합니다.

import qai_hub as hub

job_summaries = hub.get_job_summaries(limit=10)
print(job_summaries)

UI에서 특정 작업 ID(j 로 시작하는 ID, 예: jvgdwk7z5)를 제공하면 get_job() 명령을 사용하여 프로그래밍 방식으로 작업을 쿼리할 수 있습니다.

job = hub.get_job("jvgdwk7z5")
print(job)

프로필 작업

프로필 작업의 결과는 다음과 같이 ProfileJob 을 사용하여 프로그래밍 방식으로 얻을 수 있습니다.

profile = job.download_profile()
print(profile)

인쇄된 사전의 출력은 다음과 같습니다.

{
    'estimated_inference_time': 2997,
    'estimated_inference_peak_memory': 69177344,
    'first_load_time': 2162619,
    'first_load_peak_memory': 83742720,
    'warm_load_time': 123904,
    'warm_load_peak_memory': 73179136,
    'compile_time': 0,
    'compile_peak_memory': 0,
    'compile_memory_increase_range': None,
    'compile_memory_peak_range': None,
    'first_load_memory_increase_range': (0, 0),
    'first_load_memory_peak_range': (26226688, 31730736),
    'warm_load_memory_increase_range': (0, 10580480),
    'warm_load_memory_peak_range': (12865536, 37318656),
    'inference_memory_increase_range': (0, 12160),
    'inference_memory_peak_range': (12288, 21276192),
    'all_compile_times': [],
    'all_first_load_times': [2162619],
    'all_warm_load_times': [123904],
    'all_inference_times': [9130, .... ]
}

메모리는 바이트로 표현되고 시간은 마이크로초로 표현됩니다. 밀리초 단위의 대기 시간을 구하려면:

latency_ms = profile["execution_summary"]["execution_time"] / 1000

언어: 한국어

언어: English; 한국어; 日本語; 繁體中文 (台灣)