o m9:jÆMã#@s(UdZddlZddlmZddlmZddlmZddlZddl m Z edƒZedƒZiZ eejjefed <ehd £ƒZdeded eeefdeeeefgeeefffdd„Z dCddddœdejdejdejdejdBdedededejfdd„Zeddeƒ dCddddœdejdejdejdejdBdedededejfdd„ƒZd edBd!edefd"d#„Zd$ejd%ededejfd&d'„Zd(ejd)ejd*ed+ed edBd,edejfd-d.„Zd*ed+eddfd/d0„Zd(ejd)ejd*ed+ed edBdejfd1d2„Z dDdddddd3dd4œd(ejd)ejd5ejd6ejdBd7ejdBd8ejdBd9ed:ed;ed,ed edBdd?„Z"ed@de"ƒ dDdddddd3dd4œd(ejd)ejd5ejd6ejdBd7ejdBd8ejdBd9ed:ed;ed,ed edBdéé ééÚop_typeÚ opset_versionÚ fake_implÚreturncs.dtttfdtttff‡‡‡fdd„}|S)zDDecorator to register an ONNX operator with a custom implementation.ÚfuncrcsPdˆ›}tjjdˆ›d|›dd|ƒ}|ttttjjˆƒ|ƒ<| ˆ¡|S)NÚopsetzonnx::Ú.©)Úmutates_args)ÚtorchÚlibraryÚ custom_oprÚgetattrÚopsÚonnxÚ register_fake)rÚoverloadÚtorch_op©rr rrú[/home/nk/hobo-godmode/plappi-mvp/.venv/lib/python3.10/site-packages/torch/onnx/ops/_impl.pyÚ decorator's ÿþÿ z_onnx_op..decorator)rrr)r rrr!rrr Ú_onnx_op"s*r"F)ÚinterleavedÚ num_headsÚrotary_embedding_dimÚxÚ cos_cacheÚ sin_cacheÚposition_idsr#r$r%cCs| ¡S)zFFake implementation for RotaryEmbedding-23 for torch.compile purposes.)Úclone)r&r'r(r)r#r$r%rrr Ú_rotary_embedding_23_fake_impl5sr+ÚRotaryEmbeddingécs|j‰tˆƒ}ˆd‰ˆd‰ˆdurWt ˆ ¡dk‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆjdˆk‡‡fd d„¡t ˆ ¡dkoNˆ ¡dk‡‡fd d„¡nt ˆ ¡dkodˆ ¡dk‡‡fdd„¡|d krwt |d¡}n$|dkr›t |dk‡fdd„¡ˆd}||} ˆˆ|| g} t || ¡}t t|jƒd kdd„¡|jd} |dkr³| }|dd…dd…dd…d|…f}|dd…dd…dd…|d…f}|d‰ˆduräˆˆ‰ˆˆ‰nˆ‰ˆ‰t ˆjdˆko÷ˆjdˆk‡‡‡fdd„¡t ˆjdˆkoˆjdˆk‡‡‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆd¡‰t ˆd¡‰|rk|dd…dd…dd…ddd…f} |dd…dd…dd…ddd…f}n tj|ddd\} }ˆ| ˆ|}ˆ| ˆ|}|r¥t |d¡}t |d¡}tj ||fdd}t ||j¡}n tj ||fdd}tj ||fdd}|dkrÂt |ˆ¡St |d¡S)z_RotaryEmbedding-23 https://onnx.ai/onnx/operators/onnx__RotaryEmbedding.html#rotaryembedding-23réþÿÿÿNécsdˆj›S)Nz6position_ids must be 2D when provided. Received shape ©Úshaper)r)rr ÚZsz%rotary_embedding_23..csdˆ›dˆjd›S)Nz6position_ids first dim (batch) must match x.shape[0] (ú). Received rr0r)Ú batch_sizer)rr r2^ór csdˆ›dˆjd›S)Nz;position_ids second dim (sequence) must match x.shape[-2] (r3r r0r)r)Úsequence_lengthrr r2br5códˆj›dˆj›S)NzWcos_cache/sin_cache must be 2D when position_ids is provided. Received cos_cache shape ú, sin_cache shape r0r©r'r(rr r2fó ÿÿécr7)Nz[cos_cache/sin_cache must be 3D when position_ids is not provided. Received cos_cache shape r8r0rr9rr r2lr:é)rr/r r;cs dˆ›S)NzKnum_heads must be provided for 3D inputs. Received input tensor with shape rr)Úinput_shaperr r2ys cSódS)Nzx should be a 4D tensor by nowrrrrr r2€ócsdˆj›dˆ›dˆ›dS)Nzcos has shape ú but expected (batch=ú, seq=ú, ...)r0r)r4Úcosr6rr r2™ócsdˆj›dˆ›dˆ›dS)Nzsin has shape r@rArBr0r)r4r6Úsinrr r2rDéÿÿÿÿcsdˆjd›dˆ›dS)NzLast dimension of cos cache (rFú') should match rotary_embedding_dim/2 (ú).r0r)rCÚrotary_embedding_dim_halfrr r2¡ócsdˆjd›dˆ›dS)NzLast dimension of sin cache (rFrGrHr0r)rIrErr r2¥rJ©Údim) r1ÚlenrÚ_checkrLÚpermuteÚreshapeÚ unsqueezeÚchunkÚcat)r&r'r(r)r#r$r%Ú input_rankÚhidden_sizeÚ head_sizeÚ new_shapeÚx_rotateÚx_not_rotateÚx1Úx2ÚrealÚimagÚx_rotate_concatÚoutputr) r4rCr'r=r)rIr6rEr(r Úrotary_embedding_23Cs´ þþþþþ þ ÿÿþþþþÿÿ"$ r`ÚscalerVcCs|dur|Sdt |¡S)z/Get the scale factor for attention computation.Ngð?)ÚmathÚsqrt)rarVrrr Ú_get_scale_factorËsrdÚtensorr4cCs:|jd|jd}}||}| ||||¡ dd¡ ¡S)z1Reshape 3D tensor to 4D for multi-head attention.r r/)r1ÚviewÚ transposeÚ contiguous)rer4r$r6rUrVrrr Ú_reshape_3d_to_4dÐsýriÚQÚKÚcurrent_q_num_headsÚcurrent_kv_num_headsÚqk_matmul_output_modec Cs2|dkrt|||||ƒSt t || dd¡¡¡S)z1Get QK output tensor based on the specified mode.rr.rF)Ú_compute_qk_output_for_mode_0rÚ zeros_likeÚmatmulrg)rjrkrlrmrarnrrr Ú_get_qk_output_for_aten_spdaÝs ÿrrcs"t ˆˆdk‡‡fdd„¡dS)z-Validate Group Query Attention configuration.rcsdˆ›dˆ›dS)Nz q_num_heads (z%) must be divisible by kv_num_heads (z ) for GQArr©rmrlrr r2õsz-_validate_gqa_configuration..N)rrN)rlrmrrsr Ú_validate_gqa_configurationïs þrtcCs`|}||kr||}|j|dd}t||jdƒ}t |¡}||} ||} t | | dd¡¡S)zDHelper function to compute QK output for qk_matmul_output_mode == 0.r rKr;r.rF)Úrepeat_interleaverdr1rbrcrrqrg)rjrkrlrmraÚK_for_qkÚ repeat_factorÚscale_factorÚ sqrt_scaleÚQ_scaledÚK_scaledrrr roùs roç)Ú is_causalÚkv_num_headsÚq_num_headsrnraÚsoftcapÚsoftmax_precisionÚVÚ attn_maskÚpast_keyÚ past_valuer}r~rr€rcCsZ|jd} t|jƒdkrE|jd}|j}|dur,| ||jd|jd|jd|f}n| ||jd|jd|f}|}| |||df}n:|jd}|j}|duri|jd|jd|jd|jd|jdf}n|j}|}|jd|jd|jd|df}tj||j|jd}tj||j|jd}tj||j|jd}tj||j|jd}||||fS)z@Fake implementation for Attention-23 for torch.compile purposes.rr;r Nr/©ÚdtypeÚdevice)r1rMrÚemptyr‡rˆ)rjrkr‚rƒr„r…r}r~rrnrar€rr4Úq_sequence_lengthÚoutput_shapeÚpresent_key_shapeÚpresent_value_shapeÚqk_output_shaper_Úpresent_keyÚ present_valueÚ qk_outputrrr Ú_attention_23_fake_implsR üüü üür’Ú Attentionc'Cs–d\} }}t|jƒ}|jd}t|jƒdkr;t |dko|dkdd„¡|jd}t|||ƒ}t|||ƒ}t|||ƒ}t t|jƒdkoQt|jƒdkoQt|jƒdkdd„¡|j|}t| |ƒ} |d urmtj||g|d n| ¡}|d ur~tj||g|d n| ¡}||}}|j| }|j| }|j|}|j|}|dko°| dko°|d uo°|d up°|jtj k}t ||ƒ|rÕtjjj ||||d|| t ||kƒd}t||||| | ƒ}nÞ||krë||}|j|| d }|j|| d }tj|||j|jd }|rt |d udd„¡t tj||tj |jd ¡}| |tdƒ¡}|d ur4|jtj kr0| |tdƒ¡}n||}t| |jdƒ}t |¡} || }!|| }"t |!|" dd¡¡}#|#}|#|}$| dkr`|$}|dkrn|t |$|¡}$| dkru|$}|d urŸ|tvr—|$j}%|$ tj|¡}$tj|$dd }&|& |%¡}&ntj|$dd }&ntj|$dd }&| dkr|&}t |&|¡}|dkrÅ| dd¡ ¡ !||d¡}||||fS)zMAttention-23 https://onnx.ai/onnx/operators/onnx__Attention.html#attention-23)r r/r;rr;cSr>)Nz;q_num_heads and kv_num_heads must be provided for 3D inputsrrrrr r2€r?zattention_23..r r<cSr>)Nz'Q, K, and V should be 4D tensors by nowrrrrr r2‰r?NrKr|)rƒÚ dropout_pr}raÚ enable_gqar†cSr>)Nz'Cannot use both is_causal and attn_maskrrrrr r2×r?z-infr.rFr/)"rMr1rrNrirdrSr*r‡ÚboolrtÚnnÚ functionalÚscaled_dot_product_attentionrrruÚzerosrˆÚtrilÚonesÚmasked_fillÚfloatrbrcrqrgÚtanhÚ-_ATTENTION_23_ALLOWED_INTERMEDIATE_PRECISIONSÚtorÚONNX_DTYPE_TO_TORCH_DTYPEÚsoftmaxrhrf)'rjrkr‚rƒr„r…r}r~rrnrar€rÚnum_head_dimÚsequence_dimÚhead_dimÚinput_shape_lenr4rŠÚq_head_sizerrrlrmÚkv_sequence_lengthÚcan_use_sdpar_r‘rwÚ attn_biasÚcausal_maskrxryrzr{Úqk_matmul_outputÚqk_with_biasÚoriginal_dtypeÚ qk_softmaxrrr Úattention_23csä þ (þ ÿýÿý ÿþü ÿø úÿÿüÿ ÿ ÿr±)N)NNN)$Ú__doc__rbÚcollections.abcrÚtypingrÚtyping_extensionsrrÚtorch.onnx.opsrrrrÚdictÚ_opsÚ OpOverloadÚ__annotations__Ú frozensetr ÚstrÚintr"ÚTensorr–r+r`ržrdrirrrtroÚtupler’r±rrrr Ús„ÿ ÿÿ ÿ þüøÿþýüúùø ÷ üøÿþýüúùø ÷ÿÿÿ þ ÿþýüûú ùÿÿ þ ÿþýüû úúòÿþýüûúø ÷ öõô óò ñ Túòÿþýüûúø ÷ öõô óòñ