首页期刊导航|電子情報通信学会技術研究報告
期刊信息/Journal information
電子情報通信学会技術研究報告
電子情報通信学会
電子情報通信学会技術研究報告

電子情報通信学会

0913-5685

電子情報通信学会技術研究報告/Journal 電子情報通信学会技術研究報告
正式出版
收录年代

    混合ポアソン分布の実対数閾値とベイズ汎化誤差について

    渡辺澄夫佐藤件一郎
    6页
    查看更多>>摘要:混合ポアソン分布は機械学習の多くの分野において応用される重要なモデルであるが、階層構造をもつため理論的な挙動については解明されていなかった。本研究においては混合ポアソン分布を用いたベイズ推測の漸近挙動を決定する上で大切な役割を果たす双有理不変量である実対数閾値の上界と下界を導出する。

    最頻値線形回帰の情報幾何

    三戸圭史赤穂昭太郎村田昇日野英逸...
    8页
    查看更多>>摘要:MLR(Modal Linear Regression,最頻値線形回帰)は,出力の最頻値が説明変数の線形予測子で表されるというモデルに基づく回帰手法である.線形回帰と異なり,パラメトリックな分布の仮定がないという意味で制約が緩いことが,MLRの特徴の1つである.一方,パラメトリックな分布の仮定がないことが,MLRを情報幾何学の枠組みで捉える際のモデル多様体,データ多様体の構成を非自明にする.本稿では,MLRを情報幾何学の枠組みで捉えるにあたり,一般に経験分布を構成するために用いる観測データを,モデル多様体を構成するために用いることを提案する.またMEMアルゴリズムの考察を通じて,MLRにおける誤差分布の最頻値の仮定を用いた経験分布の構成方法を提案する.本稿のモデル多様体,データ多様体におけるemアルゴリズムが,MLRをEMアルゴリズムの枠組みで捉えた際のE-Step,M-Stepの計算と等しくなるという結果を得た.

    複数の距離計量を用いたた一近傍推定のための距離学習

    關翼人村田昇
    5页
    查看更多>>摘要:グラフデータなどに代表される非構造化データでは,データ間の関係を表す距離計量が複数算出されることが多い.本稿では,データ間の複数の距離計量を用いたk-近傍推定のための距離学習を提案する.提案法ではデータ間の複数の距離計量における近傍関係から,目的の距離計量におけるデータ間の近傍関係を推定する.具体的には,決定木を用いて目的の距離計量における近傍関係を保持した小さなデータ集合への直和分解を行う.Random Forest にならいブートストラップサンプリングと分解に用いる距離計量の選択により,多様なパターンによるデータ集合の分解を行い,分解の結果からデータ間の近傍度を計算する.人工データおよび間取りデータを用いた実データ実験により,提案法によるk-近傍推定における評価指標の向上を示す.

    Exponential Family of Markov Kernels and Asymptotic Exponential Family of Markov Sources

    Jun'ichi TAKEUCHIHiroshi NAGAOKA
    5页
    查看更多>>摘要:For parametric models of Markov sources, we prove that the notion of asymptotic exponential family is equivalent to the notion of exponential family of Markov kernels. The former was introduced by Takeuchi and Barron (1998) for families of general stochastic processes, inspired by the exponential family of Markov chains discovered by Ito and Amari (1988), while the latter was introduced by Nakagawa and Kanaya (1993) for one-dimensional families of Markov sources based on the discussion by Ito and Amari (1988) and later the general form was established by Nagaoka (2005). The discussion in this report is some refinement of works of Takeuchi and Nagaoka (2017).

    ブートストラップ分布に基づく外れ値検定

    渡邊隼人日野英逸赤穂昭太郎村田昇...
    7页
    查看更多>>摘要:外れ値検知あるいは異常検知は,データ集合の中で他の大多数のデータと大きく異なるデータ点あるいは少数のデータ部分集合を同定するための方法である.外れ値検知は生産プロセスなどの工学はもちろんのこと,データセキュリティや医学等,非常に広い適用範囲を持つ.データの生成モデルとして特定のパラメトリックな分布を仮定することで統計的仮説検定の枠組みを利用する方法論は広く用いられているが,実問題においてデータの分布がパラメトリックな分布で十分近似できる保証はない.また,外れ値検知はあらかじめどのサンプルが外れ値なのかという情報がない教師なし学習の問題であり,客観的かつ定量的なアプローチで外れ値を検知することは困難である.本稿では,特定の分布を仮定することなく仮説検定により客観的に外れ値を検知する方法を提案する.具体的には,た近傍距離に基づく任意の外れ値度関数を基に,検査点が外れ値か否かを仮説検定によって判別する.仮説検定を行うには検定統計量の分布が必要だが,これをブートストラップ法を用いて与えられたデータに基づいて推定する.また,提案する外れ値検定の有効性を実データを用いた実験により示す.

    Classification of Intra-Week and Intra-Day Walking Patterns and Their Effect on Body-Composition Changes Using A Hierarchical Model

    Shunichi NOMURAMichiko WATANABEYuko OGUMA
    6页
    查看更多>>摘要:In this study, we extract intra-week and intra-day activity patterns based on hourly step-count data recorded using an activity meter. The step-count measured each hour over the week is considered to be a bag of words and is applied to a hierarchical topic model with intra-day activity patterns as sub-topics and intra-week activity patterns as super-topics. Using the extracted patterns, we then analyze the dynamic relations between intra-week activities and body weight changes.

    異種データ活用のための変換複合行列分解

    小川哲司土屋平岩田具治
    8页
    查看更多>>摘要:行列分解はコンピュータ·ビジョンや文書解析,信号処理,協調フィルタリングなど,様々な分野で利用されている.行列分解は,内積が元の行列を表現するような2つの低次元行列を獲得する.また,異なる特性を持った補助行列を利用することで,行列分解を対象行列の疎性に対してより頑健にする手法として複合行列分解の有効性が知られている.しかし,複合行列分解は,対象行列と補助行列の性質が大きく異なる場合には,補助情報を有効に利用できない可能性がある.本研究では,この問題を解決するために,新しい行列分解の枠組みである変換複合行列分解を提案する.提案法では,新しく導入された共通潜在表現が異なる行列間で属性ごとに共有され,この共通潜在表現の非線形変換により各行列の潜在表現を得る.それにより,提案法では,異種関係があるような複数の行列を有効に活用することができる.3種類の実データを用いた実験により,提案法が行列分解と複合行列分解を上回る性能を持つことを示した.

    潜在変数に階層モデルを仮定したベイズ独立成分分析

    齋藤翔太堀井俊佑松嶋敏泰浅葉海...
    5页
    查看更多>>摘要:独立成分分析は,観測データを生成する未知の潜在変数を推定する問題を扱い,音声信号処理,時系列解析,画像の特徴抽出などに応用されている.独立成分分析の従来研究として,潜在変数にラプラス分布を仮定した研究があるが,潜在変数の事後分布を解析的に計算することが困難であるという問題がある.一方,スパース線形回帰問題においては,パラメータの事前分布としてラプラス分布を階層的に表現することで,事後分布の近似計算手法が適用可能となっている.本稿では,ラプラス分布を階層的に表現した事前分布を潜在変数に仮定した独立成分分析を考え,変分ベイズ法を用いてパラメータの近似事後分布を計算する手法を提案する.さらに,提案手法と従来の独立成分分析に対して,人工データによるシミュレーションを行い,有効性を検証する.

    セーフパターンブルーニングによるルールベースモデルの学習

    加藤宏樹花田博幸竹内一郎
    8页
    查看更多>>摘要:「年齢が20歳以上29歳以下,かつ体重が70kg以上80kg以下」というような「ルール」を説明変数として予測に用いるモデル(ルールベースモデル)の学習について考える.学習データセットから生成される全てのルールの数は,組合せ的に膨大になるため,その全てを用いて学習することは困難である.そこで本研究では,ルールベースモデルの学習を,パターンマイニング問題における予測モデルを学習する問題に帰着させ,セーフパターンブルーニングという手法を用いたルールベースモデルの学習手法を提案する.また,いくつかのベンチマークデータを使った数値実験を通してその有用性を示す.

    Krawczyk-Hansenによる精度保証つき大域的最適化法の局所解を用いた高速化

    高田浩彰美添一樹石井大輔津田宏治...
    8页
    查看更多>>摘要:Krawczyk-Hansenアルゴリズムとは、区間演算と分枝最適化を用いて大域的最適化を精度保証つきで行う手法である。本研究では既存の局所最適化手法を用いて発見した局所最適値を、大域最適化手法の枝刈りに利用することで高速化を図る。複数の局所解を持つことで知られるRastrigin関数の最小化実験では最大10倍の高速化を達成した。また、枝刈りに用いる局所最適解が優れているほど効率的な最適化が実現することを確認した。また、生物学で用いられるGompertz成長モデルのパラメータ推定などにおいても高速化を実現した。