###### tags:`ジャンルメンテ` # ジャンルメンテMTG0617 ## 前回まで - C分類の構造の説明 - 桁数の組み合わせで約6000通りとなる - その中で幾つかの組み合わせはTSUTAYAのジャンルに対応する - 現在の運用はこれ - C分類を用いた推定を行ってほしい - 既存のパターンマッチだけでなく確率などで示されると嬉しい - 100%マッチではなく80%マッチでも十分価値があるため ## 疑問点 - C分類をどこで入手しているのか? - daily_kinkanには含まれていないようですが… by ume - 当初C分類を参照しなかった理由もそこにあります - 日販から送られてくるものの80%は入っています by sato - 現状もその80%を用いて利用している ## 今後の期待 - CORE-DBに連携されることでC分類も得られるのではないか? ## 今後の進め方 - C分類の取得はCORE-DB連携待ちとなるため、最初は近刊情報エクセルからJANとC分類(など)を貼り付けることで運用する。 ## 表示について - 既存に加えて表示が一行増えていくイメージ - 何個表示するかは使ってみてから調整していく、デフォルト3つ程度? - コードよりも文字ジャンルが嬉しい - 結果に対する解釈性として何が必要であるか ## スケジュール ### 7月 - C分類等を用いた確率によるジャンル推定のプロトタイプ開発 - 7月3週目を目途 ### 8月 - 確率によるジャンル推定の利用開始 ## 精度上げのアイデア - 金額 - 雑誌かコミックか書籍か - 著者△ - 3桁目が●●でかつ、1桁目が◆◆なら、これこれ - このCでこの出版社のときに、雑誌だったら~書籍だったら△△ - 一ケタ目9=雑誌だったので~ ## 懸念点 - C分類を得るためにCORE-DBの連携が必須となれば、8月9月の大幅ジャンル更新タイミングに耐えられるだろうか・・・? ## :closed_book: ネクストアクション - AWSのアカウントの払い出し by abe&suzuki - Oracleデータベースのドキュメント共有 by abe&suzuki - ツールに貼り付ける形式でサンプルを頂けますか? - CSVファイルの貼り付けている内容をテキストでください - 見積書お願いします to ume ## その他機能要望 - 著者一致のときに同姓同名著者で判断が難しい - 著者CDが異なる時だけ出して欲しいです - 類書と似たタイトルの違いは? - 商品説明から特定テキストを抽出出来ないか? - ノイズが多くなりそう(確度が落ちそう)な懸念はあります - 改善する部分はあるとは思うので何かやれないか検討してみます
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up