<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ko">
	<id>http://junhoahn.kr/noriwiki/index.php?action=history&amp;feed=atom&amp;title=Backward_propagation</id>
	<title>Backward propagation - 편집 역사</title>
	<link rel="self" type="application/atom+xml" href="http://junhoahn.kr/noriwiki/index.php?action=history&amp;feed=atom&amp;title=Backward_propagation"/>
	<link rel="alternate" type="text/html" href="http://junhoahn.kr/noriwiki/index.php?title=Backward_propagation&amp;action=history"/>
	<updated>2026-05-19T11:21:21Z</updated>
	<subtitle>이 문서의 편집 역사</subtitle>
	<generator>MediaWiki 1.43.0</generator>
	<entry>
		<id>http://junhoahn.kr/noriwiki/index.php?title=Backward_propagation&amp;diff=710&amp;oldid=prev</id>
		<title>Ahn9807: 새 문서: 분류: 딥러닝  가운데 == 개요 == 최적화할 함수 &lt;math&gt;f(\mathbf{x})&lt;/math&gt;에 대하여, 먼저 시작점 &lt;math&gt;\mathbf{x}_0&lt;/math&gt;를 정한다. 현재 &lt;math&gt;\mathbf{x}_i&lt;/math&gt;가 주어졌을 때, 그 다음으로 이동할 점인 &lt;math&gt;\mathbf{x}_{i+1}&lt;/math&gt;은 다음과 같이 계산된다. :&lt;math&gt;\mathbf{x}_{i+1} = \mathbf{x}_i - \gamma_i \nabla f(\mathbf{x}_i)&lt;/math&gt; 이때 &lt;math&gt;\gamma_i&lt;/math&gt;는 이...</title>
		<link rel="alternate" type="text/html" href="http://junhoahn.kr/noriwiki/index.php?title=Backward_propagation&amp;diff=710&amp;oldid=prev"/>
		<updated>2023-02-21T01:28:17Z</updated>

		<summary type="html">&lt;p&gt;새 문서: &lt;a href=&quot;/noriwiki/index.php?title=%EB%B6%84%EB%A5%98:%EB%94%A5%EB%9F%AC%EB%8B%9D&quot; title=&quot;분류:딥러닝&quot;&gt;분류: 딥러닝&lt;/a&gt;  &lt;a href=&quot;/noriwiki/index.php?title=%ED%8C%8C%EC%9D%BC:Backward_Propagation.png&quot; title=&quot;파일:Backward Propagation.png&quot;&gt;500px|섬네일|가운데&lt;/a&gt; == 개요 == 최적화할 함수 &amp;lt;math&amp;gt;f(\mathbf{x})&amp;lt;/math&amp;gt;에 대하여, 먼저 시작점 &amp;lt;math&amp;gt;\mathbf{x}_0&amp;lt;/math&amp;gt;를 정한다. 현재 &amp;lt;math&amp;gt;\mathbf{x}_i&amp;lt;/math&amp;gt;가 주어졌을 때, 그 다음으로 이동할 점인 &amp;lt;math&amp;gt;\mathbf{x}_{i+1}&amp;lt;/math&amp;gt;은 다음과 같이 계산된다. :&amp;lt;math&amp;gt;\mathbf{x}_{i+1} = \mathbf{x}_i - \gamma_i \nabla f(\mathbf{x}_i)&amp;lt;/math&amp;gt; 이때 &amp;lt;math&amp;gt;\gamma_i&amp;lt;/math&amp;gt;는 이...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;새 문서&lt;/b&gt;&lt;/p&gt;&lt;div&gt;[[분류: 딥러닝]]&lt;br /&gt;
&lt;br /&gt;
[[파일:Backward Propagation.png|500px|섬네일|가운데]]&lt;br /&gt;
== 개요 ==&lt;br /&gt;
최적화할 함수 &amp;lt;math&amp;gt;f(\mathbf{x})&amp;lt;/math&amp;gt;에 대하여, 먼저 시작점 &amp;lt;math&amp;gt;\mathbf{x}_0&amp;lt;/math&amp;gt;를 정한다. 현재 &amp;lt;math&amp;gt;\mathbf{x}_i&amp;lt;/math&amp;gt;가 주어졌을 때, 그 다음으로 이동할 점인 &amp;lt;math&amp;gt;\mathbf{x}_{i+1}&amp;lt;/math&amp;gt;은 다음과 같이 계산된다.&lt;br /&gt;
:&amp;lt;math&amp;gt;\mathbf{x}_{i+1} = \mathbf{x}_i - \gamma_i \nabla f(\mathbf{x}_i)&amp;lt;/math&amp;gt;&lt;br /&gt;
이때 &amp;lt;math&amp;gt;\gamma_i&amp;lt;/math&amp;gt;는 이동할 거리를 조절하는 매개변수이다. (역 삼각형 기호는 [[그라디언트]]를 의미한다.)&lt;br /&gt;
&lt;br /&gt;
== Convergence of backprop ==&lt;br /&gt;
Perceptron은 convex optimization문제를 풀어야 한다. 이때 여러개의 global minimun (global minima-복수형)중에서 하나의 global minimum을 찾아야 한다. Mutilayer Perceptrons (MLP)는 convex하지 않는다. 따라서 Gradient decent는 local minima에서 수렴하게 된다. 그러나 이러한 local minima가 최선인지는 알 수가 없다. 즉 hyper-parameter설정이 매우 중요하게 된다. 또한 MLP에서 수렴하지 않을 수 있다. 즉 수렴성을 보장하지 않는다. 이러한 MLP를 학습시키기 위해서 back propagation이 사용된다. &lt;br /&gt;
&lt;br /&gt;
== GD 알고리즘 ==&lt;br /&gt;
최적화할 함수 &amp;lt;math&amp;gt;f(\mathbf{x})&amp;lt;/math&amp;gt;에 대하여, 먼저 시작점 &amp;lt;math&amp;gt;\mathbf{x}_0&amp;lt;/math&amp;gt;를 정한다. 현재 &amp;lt;math&amp;gt;\mathbf{x}_i&amp;lt;/math&amp;gt;가 주어졌을 때, 그 다음으로 이동할 점인 &amp;lt;math&amp;gt;\mathbf{x}_{i+1}&amp;lt;/math&amp;gt;은 다음과 같이 계산된다.&lt;br /&gt;
:&amp;lt;math&amp;gt;\mathbf{x}_{i+1} = \mathbf{x}_i - \gamma_i \nabla f(\mathbf{x}_i)&amp;lt;/math&amp;gt;&lt;br /&gt;
이때 &amp;lt;math&amp;gt;\gamma_i&amp;lt;/math&amp;gt;는 이동할 거리를 조절하는 매개변수이다. (역 삼각형 기호는 [[그라디언트]]를 의미한다.) 이때 인공지능에서는 이러한 GD 알고리즘을 계속해서 뒤로 Back propagation하면서 weight을 업데이트 하게 된다.&lt;/div&gt;</summary>
		<author><name>Ahn9807</name></author>
	</entry>
</feed>