o
    <Æ&iÌ1  ã                   @   sf  d dl Z d dl mZ ddlmZmZmZmZmZmZm	Z	 d dl
mZmZ ddgZG dd„ deƒZd	d
e› de› de› d e_				ddee dee dee dee dee dededededededefdd„Zdee dee dee dee dededededededefdd„Zdee dee dee dee dededededededefdd„ZdS ) é    N)ÚTensoré   )Ú	OptimizerÚ_use_grad_for_differentiableÚ_default_to_fused_or_foreachÚ_differentiable_docÚ_foreach_docÚ_maximize_docÚ_view_as_real)ÚListÚOptionalÚRpropÚrpropc                       sb   e Zd Z			dddddœdee ded	ef‡ fd
d„Z‡ fdd„Zdd„ Zeddd„ƒZ	‡  Z
S )r   ç{®Gáz„?©g      à?g333333ó?©gíµ ÷Æ°>é2   NF)ÚforeachÚmaximizeÚdifferentiabler   r   r   c          	         s€   d|kst d|› ƒ‚d|d   k rd  k r|d k s-n t d|d › d|d › ƒ‚t||||||d}tƒ  ||¡ d S )	Ng        zInvalid learning rate: r   g      ð?r   zInvalid eta values: z, )ÚlrÚetasÚ
step_sizesr   r   r   )Ú
ValueErrorÚdictÚsuperÚ__init__)	ÚselfÚparamsr   r   r   r   r   r   Údefaults©Ú	__class__© ú<C:\wamp64\www\opt\env\Lib\site-packages\torch/optim/rprop.pyr      s   (úzRprop.__init__c                    s@   t ƒ  |¡ | jD ]}| dd ¡ | dd¡ | dd¡ q	d S )Nr   r   Fr   )r   Ú__setstate__Úparam_groupsÚ
setdefault)r   ÚstateÚgroupr    r"   r#   r$   %   s   
ýzRprop.__setstate__c           
      C   s  d}|d D ]x}|j d u rq|t |¡O }| |¡ |j }|jr$tdƒ‚| |¡ | j| }	t|	ƒdkrhd|	d< tj|tj	d|	d< |j
jrZ| ¡  |¡ t|d |d ƒ¡|	d	< n| ¡  |¡ |d ¡|	d	< | |	d ¡ | |	d	 ¡ |	d  d
7  < q|S )NFr   z'Rprop does not support sparse gradientsr   Ústep©Zmemory_formatÚprevr   Ú	step_sizer   )ÚgradÚtorchÚ
is_complexÚappendZ	is_sparseÚRuntimeErrorr'   ÚlenZ
zeros_likeÚpreserve_formatZdtypeÚnewZ
resize_as_Zfill_Úcomplex)
r   r(   r   ÚgradsÚprevsr   Úhas_complexÚpr-   r'   r"   r"   r#   Ú_init_group,   s6   




ÿýÿzRprop._init_groupc                 C   s¸   d}|durt  ¡  |ƒ }W d  ƒ n1 sw   Y  | jD ]9}g }g }g }g }|d \}}	|d \}
}|d }|d }|  |||||¡}t|||||
|||	|||d |d q |S )z±Performs a single optimization step.

        Args:
            closure (Callable, optional): A closure that reevaluates the model
                and returns the loss.
        Nr   r   r   r   r   )Ústep_size_minÚstep_size_maxÚetaminusÚetaplusr   r   r   r8   )r.   Zenable_gradr%   r:   r   )r   ÚclosureZlossr(   r   r6   r7   r   r=   r>   r;   r<   r   r   r8   r"   r"   r#   r)   S   s<   
ÿ
ôz
Rprop.step)r   r   r   )N)Ú__name__Ú
__module__Ú__qualname__r   Úboolr   r$   r:   r   r)   Ú__classcell__r"   r"   r    r#   r   
   s&    û÷ùø	÷'aÁ
  Implements the resilient backpropagation algorithm.

    .. math::
       \begin{aligned}
            &\rule{110mm}{0.4pt}                                                                 \\
            &\textbf{input}      : \theta_0 \in \mathbf{R}^d \text{ (params)},f(\theta)
                \text{ (objective)},                                                             \\
            &\hspace{13mm}      \eta_{+/-} \text{ (etaplus, etaminus)}, \Gamma_{max/min}
                \text{ (step sizes)}                                                             \\
            &\textbf{initialize} :   g^0_{prev} \leftarrow 0,
                \: \eta_0 \leftarrow \text{lr (learning rate)}                                   \\
            &\rule{110mm}{0.4pt}                                                                 \\
            &\textbf{for} \: t=1 \: \textbf{to} \: \ldots \: \textbf{do}                         \\
            &\hspace{5mm}g_t           \leftarrow   \nabla_{\theta} f_t (\theta_{t-1})           \\
            &\hspace{5mm} \textbf{for} \text{  } i = 0, 1, \ldots, d-1 \: \mathbf{do}            \\
            &\hspace{10mm}  \textbf{if} \:   g^i_{prev} g^i_t  > 0                               \\
            &\hspace{15mm}  \eta^i_t \leftarrow \mathrm{min}(\eta^i_{t-1} \eta_{+},
                \Gamma_{max})                                                                    \\
            &\hspace{10mm}  \textbf{else if}  \:  g^i_{prev} g^i_t < 0                           \\
            &\hspace{15mm}  \eta^i_t \leftarrow \mathrm{max}(\eta^i_{t-1} \eta_{-},
                \Gamma_{min})                                                                    \\
            &\hspace{15mm}  g^i_t \leftarrow 0                                                   \\
            &\hspace{10mm}  \textbf{else}  \:                                                    \\
            &\hspace{15mm}  \eta^i_t \leftarrow \eta^i_{t-1}                                     \\
            &\hspace{5mm}\theta_t \leftarrow \theta_{t-1}- \eta_t \mathrm{sign}(g_t)             \\
            &\hspace{5mm}g_{prev} \leftarrow  g_t                                                \\
            &\rule{110mm}{0.4pt}                                                          \\[-1.ex]
            &\bf{return} \:  \theta_t                                                     \\[-1.ex]
            &\rule{110mm}{0.4pt}                                                          \\[-1.ex]
       \end{aligned}

    For further details regarding the algorithm we refer to the paper
    `A Direct Adaptive Method for Faster Backpropagation Learning: The RPROP Algorithm
    <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.1417>`_.
    aò  
    Args:
        params (iterable): iterable of parameters to optimize or dicts defining
            parameter groups
        lr (float, optional): learning rate (default: 1e-2)
        etas (Tuple[float, float], optional): pair of (etaminus, etaplus), that
            are multiplicative increase and decrease factors
            (default: (0.5, 1.2))
        step_sizes (Tuple[float, float], optional): a pair of minimal and
            maximal allowed step sizes (default: (1e-6, 50))
        z	
        z

    Fr   r6   r7   r   r   r   r   r8   r;   r<   r=   r>   c                C   sj   |du rt | |dd\}}|rtj ¡ rtdƒ‚|r"tj ¡ s"t}nt}|| |||||	|
||||d dS )zpFunctional API that performs rprop algorithm computation.

    See :class:`~torch.optim.Rprop` for details.
    NF)Z	use_fusedz6torch.jit.script not supported with foreach optimizers)r;   r<   r=   r>   r   r   r8   )r   r.   ZjitZis_scriptingr1   Ú_multi_tensor_rpropÚ_single_tensor_rprop)r   r6   r7   r   r   r   r   r8   r;   r<   r=   r>   Ú_Úfuncr"   r"   r#   r   °   s(   
õc                C   s
  t | ƒD ]~\}}|| }|s|n| }|| }|| }t |¡r4t |¡}t |¡}t |¡}t |¡}|	r@| | ¡ ¡ ¡ }n| |¡ ¡ }||| d¡< ||| d¡< d|| 	d¡< | 
|¡ ||¡ |jtjd}d|| 	|¡< |j| ¡ |dd | |¡ qd S )Nr   r   r*   éÿÿÿÿ©Úvalue)Ú	enumerater.   r/   Zview_as_realÚmulÚcloneÚsignÚgtÚltÚeqZmul_Úclamp_r3   Zaddcmul_Zcopy_)r   r6   r7   r   r;   r<   r=   r>   r   r   r8   ÚiÚparamr-   r+   r,   rO   r"   r"   r#   rF   à   s,   


ãrF   c                C   sH  t | ƒdkrd S |	rJ dƒ‚t | |||g¡}| ¡ D ]†\\}}}}}|
r,t||||ƒ t ||¡}|r9t |¡ t ||¡ |rFt |¡ |}t 	|¡ |D ]}||| 
d¡< ||| d¡< d|| d¡< qOt ||¡ |D ]}| ||¡ qot|ƒ}tt |ƒƒD ]}d|| ||  |¡< q‚~dd„ |D ƒ}tj|||dd qd S )Nr   z#_foreach ops don't support autogradr   c                 S   s   g | ]}|  ¡ ‘qS r"   )rO   )Ú.0r-   r"   r"   r#   Ú
<listcomp>J  s    z'_multi_tensor_rprop.<locals>.<listcomp>rI   rJ   )r2   r   Z"_group_tensors_by_device_and_dtypeÚvaluesr
   r.   Z_foreach_mulZ_foreach_neg_Z_foreach_copy_Z_foreach_sign_rP   rQ   rR   Z_foreach_mul_rS   ÚlistÚrangeZ_foreach_addcmul_)r   r6   r7   r   r;   r<   r=   r>   r   r   r8   Zgrouped_tensorsZgrouped_paramsZgrouped_gradsZgrouped_prevsZgrouped_step_sizesrG   ZsignsrO   r,   rT   Z
grad_signsr"   r"   r#   rE     s:   


ÙrE   )NFFF)r.   r   Z	optimizerr   r   r   r   r   r	   r
   Útypingr   r   Ú__all__r   Ú__doc__rC   Úfloatr   rF   rE   r"   r"   r"   r#   Ú<module>   s´    $t"
öõôÞ9öÿþýüùø	÷
öôóò
ñ0ÿþýüúùø	÷
öõ
ô/ÿþýüúùø	÷
öõô