μ΄ λ Όλ¬Έμ DNN(μ¬μΈ΅ μ κ²½λ§)λͺ¨λΈμ μ€μκ° μΆλ‘ μ μν΄ μλ² λλ μ₯μΉμμ μ΅μ ννλ μ¬λ¬κ°μ§ λ°©λ²λ€μ λνκ²μ΄λ€.

< μ£Όμ λ΄μ© >
λͺ¨λΈ κ²½λν(Model Compression):
DNN λͺ¨λΈμ μλ² λλ μ₯μΉμ μ ν©νλλ‘ κ²½λννλ κΈ°μ μ΄ νμνλ€. μ΄λ₯Ό μν΄ κ°μ€νΌ ν루λ(pruning), μμν(quantization), μ§μ μ¦λ₯(knowledge distillation)λ±μ μ¬μ©ν΄μ λͺ¨λΈ ν¬κΈ°λ₯Ό μ€μΌ μ μλ€.
μ΄λ¬ν κΈ°λ²λ€μ λͺ¨λΈμ μ±λ₯μ μ μ§νλ©΄μ κ³μ° μμκ³Ό λ©λͺ¨λ¦¬ μ¬μ©μ μ΅μ ν νλ€.
νλμ¨μ΄ κ°μ(Hardware Acceleration):
μλ² λλ μμ€ν μμμ DNNμΆλ‘ μλλ₯Ό λμ΄κΈ° μν΄, FPGAλ ASICκ³Ό κ°μ νλμ¨μ΄ κ°μκΈ°λ₯Ό νμ©ν μ μλ€.
μ΄λ λ³λ ¬μ²λ¦¬λ₯Ό νμ©νμ¬ μ€μκ° μΆλ‘ μ±λ₯μ κ·Ήλν νλλ° μ 리νλ€.γ
λͺ¨λΈ λ μ΄μ΄ ν΅ν©(Layer Fusion)
μ¬λ¬ λ μ΄μ΄λ₯Ό μν λλ μμ§μΌλ‘ μ΅ν©νμ¬ μ°μ°λμ μ€μ΄λ λ°©λ²λ μλ€.
μλ₯Όλ€μ΄, CNN(ν©μ±κ³± μ κ²½λ§)λͺ¨λΈμμ μ¬λ¬κ°μ ν©μ±κ³± μ°μ°μ νλμ μ°μ°μΌλ‘ ν΅ν©νμ¬ λͺ¨λΈμ ν¨μ¨μ±μ λμΌ μ μλ€.
μ΅μ νλ μ λ ₯μ²λ¦¬(Optimized input Processing):
μ λ ₯λ°μ΄ν°λ₯Ό μ²λ¦¬νλ λ°©μλ μ€μν μν μ νλ€.
λ¨κΈ° νΈλ¦¬μ λ³ν(STFT)κ³Ό κ°μ λ°©λ²μ μ¬μ©νμ¬ ν¨μ¨μ μΈ μ λ ₯ λ³νμ ν΅ν΄ μ°μ° μ±λ₯μ ν₯μμν¬ μ μλ€.
μ€μκ° μΆλ‘ μ μν μ΅μ νλ DNNꡬ쑰:
μλμ°¨μ κ°μμ€μκ° μλΉμ€μ μ ν©ν DNNλͺ¨λΈμ μ΅μ ννλ €λ©΄, μ°μ° ν¨μ¨μ±μ΄ μ€μν μμκ° λλ€.
μλ₯Όλ€μ΄, μν λ° μμ§μΌλ‘ λ μ΄μ΄λ₯Ό μ΅ν©(fusion)νμ¬ μ€νμκ°μ λ¨μΆμν€κ³ , λͺ¨λΈμ μ νλλ μ μ§νλ λ°©λ²μ΄ ν¨κ³Όμ μ΄λ€.

μ΄λ¬ν μ΅μ ν λ°©λ²λ€μ μλ² λλ μμ½λ©μμ μ€μκ° μΆλ‘ μ κ°λ₯νκ² νλ μ€μν κΈ°μ μ΄λ€.
κ°κΈ° λ€λ₯Έ νλμ¨μ΄μ μννΈμ¨μ΄ μꡬμ¬νμ λ°λΌ μ΅μ ν κΈ°λ²μ μ‘°ν©ν΄μ μ¬μ©νλ©° λ λμ μ±λ₯μ μ»μ μ μλ€.