首页期刊导航|電子情報通信学会技術研究報告
期刊信息/Journal information
電子情報通信学会技術研究報告
電子情報通信学会
電子情報通信学会技術研究報告

電子情報通信学会

0913-5685

電子情報通信学会技術研究報告/Journal 電子情報通信学会技術研究報告
正式出版
收录年代

    空間周波数と色に基づく損失関数を用いた畳み込みオートエンコーダの学習

    市村直幸
    6页
    查看更多>>摘要:本論文では,画像からの特徴抽出を目的とした畳み込みオートエンコーダ(Convolutional Autoen-coders:CAEs)の学習方法を示す.CAEsは,convolutional neural networksにより恒等写像を近似する教師なし学習を通じ得られる.その学習には,入力である原画像と出力である再構成画像,この2つの画像の画素値の平均2乗誤差(Pixel Loss:PL)に基づく損失関数が用いられる.しかし,その損失関数を用いた学習には,再構成画像にボケが生じる,および,色の再現に多くのエポック数を必要とするという問題がある.これらの問題を解決するため,空間周波数と色に基づく損失関数を用いた学習方法を提案する.再構成画像におけるボケの発生は,高い空間周波数成分が欠落することを意味する.この欠落を評価するために,Laplacianフィルタバンクを重みとする畳み込み層をCAEsに付加し,各Laplacianフィルタの出力から部分帯域の平均2乗誤差(Spatial Frequency Loss:SFL)を求める.また,色の再現を評価するためには,色成分と輝度成分を分離する畳み込み層を付加し,色成分の平均2乗誤差(Chromatic Loss:CL)を求める.そして,SFLおよびCLに基づく損失関数を用い学習を行う.実験を通じ,SFLの導入により再構成画像のボケが軽減され,また,CLの導入により色の再現が促進されることを明らかにした.

    Pyramid Transform Revised

    Kento HOSOYAAtsushi IMIYA
    6页
    查看更多>>摘要:We introduce a framework on a general order pyramid transform for variational multiresolution registration. The traditional pyramid transform shrinks the image to an image of the quarter size. If the result of the pyramid transform is expressed in the same landscape with the original images, the result of the transform yields a low-resolution image. The pyramid transform is achieved by subsampling after linear smoothing. Furthermore, the dual operation of the pyramid transform is achieved by linear interpolation after upsampling. The rational-order pyramid transform is decomposed into subsampling by linear interpolation and the traditional pyramid transform. By controlling ration between subsampling for linear interpolation and subsampling in the pyramid transform, we construct the rational-order pyramid transform.

    料理画像認識と料理材料推定の同時学習モデル

    伊藤晃洋山中高夫
    6页
    查看更多>>摘要:近年,健康志向の高まりにより食事を記録し健康を管理するアプリケーションが増えてきている.それに伴い,料理画像認識や材料推定の重要性も高まってきている.一般画像認識では畳み込みニューラルネットワーク(CNN)の登場により飛躍的に精度が向上した.CNNを用いた料理画像認識と材料推定を同時に行うことで料理画像認識の精度も向上することが報告されている.しかし,従来のモデルでは単純な構造しか検討されていなかった.本研究では料理画像認識と材料推定の同時学習に対して,料理と材料の相互関係を活かした様々なモデルを提案した.評価実験の結果,ほぼ全ての手法で従来手法を超える精度を達成した.提案したモデルでは料理画像認識が最大で1.4%,材料推定のMicro-F1が最大で1.82%,Macro-F1が最大で6.52%向上し,従来手法を大きく上回ることができた.

    Estimating 2D Gaze Coordinates from Efficiently Compressed Face Images

    Reo OgusuTakao Yamanaka
    6页
    查看更多>>摘要:Gaze tracking is an important tool in many domains. Recent development in Convolutional Neural Networks (CNN) has allowed invention of gaze tracking techniques that work on commodity hardware such as a camera on a personal computer. Moreover, it has been shown that information from the full-face region can provide better performance than from an eye image alone. However, the problem with using the full-face image is the heavy computation cost due to the large image size. This study tackles this problem by efficiently compressing face images using importance weights to face regions. It is shown that the image compressed with the proposed method preserves the accuracy than the image resized as it is.

    Multi-Element Deep Learning Using False Detection Images for Training Set - Effective For License Plate Detection

    Kazuo OHZEKIYoshikazu KIDOYutaka HIRAKAWAStefan SCHNEIDER...
    6页
    查看更多>>摘要:In deep learning, in order to improve learning performance, preprocessing and ingenuity to combine a plurality of discriminators are performed. It can be inferred that it has elements exceeding the set of learning. Therefore, a configuration to combine multiple recognition elements with low loss will be studied. The advance category classification method is expected to narrow the scope of learning in the next stage. Combining elements specialized for FalsePositive/FalseNegative removal after the positive/negative determination is considered to be effective if the accuracy of the subsequent stage is high. We conducted a license plate recognition experiment by combining these and achieved the best performance for Caltech data.

    畳み込みニューラルネットワークを用いた運動視差による物体形状特徴の抽出

    邵成駿村上真
    6页
    查看更多>>摘要:畳み込みニューラルネットワーク(CNN)は優れた特徴抽出能力を持っている.本研究では,空間的特徴抽出CNNと時空間的特徴抽出CNNといった異なる2つのCNNを用いて,単眼カメラにより撮影されたカラー動画像から物体の3次元形状特徴を抽出することができる手法を提案する.具体的には,学習済みの空間的特徴抽出CNNにより空間的特徴量を抽出し,それらを時空間的特徴抽出CNNに入力して学習を行い,物体形状特徴を抽出する.単純な形状の積み木を用いて実験を行った結果,運動軌跡や運動方向の特徴を抽出することができた.

    正規化クロスパワースペクトルの形状判別による高速な画像マッチング手法の提案

    高橋徹牧野賢吾工藤佑太石山塁...
    6页
    查看更多>>摘要:本稿では,並進·回転·スケール変動のある画像を高速に照合できるパターンマッチング手法を提案する.従来,バイオメトリクスや人工物メトリクスによる個体識別など,特に高精度な画像マッチングが求められる分野で,画像間の相関に基づくパターンマッチング手法が用いられている.一般的な手法では,撮影時に不可避な幾何変動を補正するために,相関演算を繰り返し行い,空間領域での相関値マップを求める.その処理量は多く,大規模なデータベースから個体を識別·照合する用途においては,処理速度の面で課題があった.本稿では,画像のFourier-Mellin 変換後の周波数特徴の正規化クロスパワースペクトルを求め,その周波数領域での分布形状を判別することで,照合する画像間の同一性を高速に判定する手法を提案する.実験では,提案手法を物体指紋認証による工業製品の個体識別に適用した.均一に塗装されたプレート部品11,571個体を誤りなく識別できる照合精度と,汎用デスクトップPCを用いて1 vs 11,571照合を約0.83秒で処理できる高速性を確認した.

    Investigation of Speaker Verification Performance Using Air and Ear Microphones in Various Acoustic Conditions

    Qiongqiong WANGKoji OKABEShivangi MAHTOTakafumi KOSHINAKA...
    6页
    查看更多>>摘要:This paper presents an experimental study on speaker verification performances using air and ear microphones in various acoustic conditions. Most existing speaker verification systems use an air microphone. Such systems often suffer from real environments which practically include background noise and/or reverberation. Ear microphone, whose transmission bandwidth is often limited due to skin or bone conduction, gives poor performance as compared with air microphone under ideal condition, while it is worn on the user's ear and hence robust to background noise. This paper attempts to discover suitable conditions for speaker verification systems using those two microphones. Effective combination of the microphones is also studied in terms of score fusion.

    眼球-頭部協調運動の個人差を用いた生体反射認証方式に関する検討(その2)

    高橋洋介遠藤将松野宏昭村松弘明...
    6页
    查看更多>>摘要:生体情報は一般的に容易に漏洩するという問題が存在するため,生体情報が漏洩した場合であってもなりすましが困難な生体情報が望ましい.これに対して,生体の反射を利用した認証方式が提案されている.著者らは2017年5月BioX研究会において,視標を注視する際の反射的な動きである眼球-頭部協調運動の個人差を用いた認証方式を提案し,単一時刻(視標注視時)の眼球と頭部の位置情報を利用したプロトタイプシステムによって本認証方式の実現可能性を検討した.しかし,本提案方式の本質は移動する視標を眼で追う際のユーザの動的な振る舞いの中に含まれる個人性を利用することにある.そこで本稿では,単一時刻の静止画だけでなく,視標注視時の動的な動きを用いて実験を行うことで,眼球-頭部協調運動に基づく生体反射認証の本来の可用性について検討を行う.

    利用環境認識機能を用いた多要素認証に関する一検討

    東知明山崎恭大木哲史
    6页
    查看更多>>摘要:近年,スマートフォンやタブレットPCなどのスマートデバイスの急速な普及に伴い,スマートデバイスにおけるユーザ認証技術として,スマートデバイスに搭載されたセンサから取得可能な生体情報を利用する生体認証技術が注目されている.一方,スマートデバイスは可搬性に優れ,様々な環境で利用されることから,スマートデバイスにおけるユーザ認証では,利用環境の相違がユーザ認証の信頼性に与える影響に特に留意する必要がある.そこで,本稿では,この問題に対処する一つの方法として,人や物事の状況や変化を認識するという概念である「コンテキストアウェアネス(Context Awareness)」に基づくマルチファクタ認証システムに着目し,当該システムの実現に向けた種々の技術的課題に関する検討を行うことを目的とする.特に,利用環境の変動に対して頑健性を有する認証システムを実現するため,利用環境認識機能を用いて,ユーザ認証に必要な各機能に対して適切な処理を施す手法を提案するとともに,その有効性を実際の生体情報を用いたシミュレーション実験に基づき評価した結果について報告する.