アカウント名:
パスワード:
子ども向けYouTubeに、タブー用語の自動字幕を表示する問題 インドの研究チームが指摘 [itmedia.co.jp]
Google speech-to-textを用いて動画からタブー用語を抽出した結果、330個が見つかった。中でも明らかに不適切な用語のみに絞ると「bitch」「bastard」「penis」「crappy」などが、特に変換される可能性が高いと分かった。
この辺りの言葉を特に間違える(というか不明瞭な場合にこれと推定しがち、つまりお好き?)らしい。てっきりトップは f**k だと思ったし例題でも duck を f**k と読み違えているみたいだけど、割合としてはそうらしい。# 卑猥な言葉とか侮蔑の言葉は子ども向けなら確かに防ぎたい所だけど、俗語は本来の意味もあるわけで難しいのぅ
「タブー単語リスト」どこにあんの?
単語リスト自体はコレ [cmu.edu]元の論文 [github.com]で脚注14として示されている
自動翻訳の出力単語で、タブー単語リストにヒットしたら XXXXX に置き換えるとかできひんのかな"
子供向けではないがそういうツールはあるが非常に評判が悪い [gigazine.net]。
そういうAI支援ツールってエンドユーザ側で調教(学習)できれば良いと思うけど。その学習結果を戻すようにすると、一部の特異なユーザががんばるから結果的にアカンか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
特に間違えられるのは「bitch」「bastard」「penis」「crappy」 (スコア:0)
子ども向けYouTubeに、タブー用語の自動字幕を表示する問題 インドの研究チームが指摘 [itmedia.co.jp]
Google speech-to-textを用いて動画からタブー用語を抽出した結果、330個が見つかった。中でも明らかに不適切な用語のみに絞ると「bitch」「bastard」「penis」「crappy」などが、特に変換される可能性が高いと分かった。
この辺りの言葉を特に間違える(というか不明瞭な場合にこれと推定しがち、つまりお好き?)らしい。
てっきりトップは f**k だと思ったし例題でも duck を f**k と読み違えているみたいだけど、割合としてはそうらしい。
# 卑猥な言葉とか侮蔑の言葉は子ども向けなら確かに防ぎたい所だけど、俗語は本来の意味もあるわけで難しいのぅ
Re: (スコア:0)
「タブー単語リスト」
どこにあんの?
Re: (スコア:0)
単語リスト自体はコレ [cmu.edu]
元の論文 [github.com]で脚注14として示されている
Re: (スコア:1)
自動翻訳の出力単語で、タブー単語リストにヒットしたら XXXXX に置き換えるとかできひんのかな"
Re: (スコア:0)
子供向けではないがそういうツールはあるが非常に評判が悪い [gigazine.net]。
Re:特に間違えられるのは「bitch」「bastard」「penis」「crappy」 (スコア:1)
そういうAI支援ツールってエンドユーザ側で調教(学習)できれば良いと思うけど。
その学習結果を戻すようにすると、一部の特異なユーザががんばるから結果的にアカンか。