コスト効率を高めるプロンプトキャッシングも導入:
OpenAI、AIモデルのマルチモーダル対応やファインチューニング機能強化を発表 無料でどこまで使える?
OpenAIは、同社のAIモデル向けの「Realtime API」(パブリックβ版)、「Chat Completions API」の音声入出力サポート、「ビジョンファインチューニング」機能、「Model Distillation」スイート、「プロンプトキャッシング」を発表した。(2024/10/4)
「緑のシャツのお兄さん、いらっしゃいませなのだ」 目の前のお客を接客する「AI売り子」が登場
Gateboxは、小売店向けAI接客サービス「AI売り子」を提供開始した。価格は月額2万円から。(2024/9/26)
メタバース霊園「風の霊」開設 VR空間で供養 将来は「AIで再現した故人と会話」も
メタバース空間内で、友人や家族と集まって故人を供養できる霊園「風の霊」のサービスがスタート。(2024/9/11)
Marketing Dive:
マーケターとクリエイターがAIに仕事を奪われないための心得5選【後編】
AIが進化し、マーケターやクリエイターの活動に影響を及ぼしている。AIはクリエイターにとって脅威なのか。コンテンツマーケティング会社の創設者に、AIと共存するための心得を聞いた。(2024/9/4)
会話できる「リカちゃん」にボーイフレンドのことを尋ねてみたら……
リカ・ミーツは「リカちゃんと本当にお話ができたら」という子ども達の夢を叶えるため、最新のデジタル技術を使って作り出した新しいコミュニケーションツール。今回はリカちゃんのボーイフレンドについて聞いてみました。(2024/8/30)
会話もできるデジタルなリカちゃん「Licca Meets」、東京おもちゃショーに登場
アタリは27日、タカラトミーの「リカちゃん」をデジタル化し、人と対話できる新コンテンツ「Licca Meets(リカ・ミーツ)」を発表した。(2024/8/27)
OpenAI、「GPT-4o」のリスク評価結果を公開 「リスクは中程度」と判断
OpenAIは、生成AIの最新モデル「GPT-4o」のリリース前に実施した安全対策とリスク評価を概説する文書「System Card」を公開した。レッドチームの評価を元に、OpenAIは「リスクは中程度」と判断したとしている。(2024/8/9)
「天才現る」 ケチャップとマスタードの容器をよく見たら…… “まさかの連想”に「これは盲点だったわ」
な、なるほど……。(2024/8/9)
ニコニコ、サービスを正式再開 復旧までに2カ月 アクセス集中で「ニコニコ鯖落ち」もトレンド入り
ドワンゴは5日、サイバー攻撃の影響でサービスを停止していたニコニコを、新バージョン「帰ってきたニコニコ」として午後3時に再開した。(2024/8/5)
その悩み、生成AIが解決:
会社のSNSが読まれない……ChatGPTで改善する方法は?
効果的な企業のSNS運用の戦略を立てたい――。そんなとき、ChatGPTをいかに活用できるのか。(2024/7/26)
プロダクトInsights:
Yahoo!カーナビに生成AIを活用した音声案内機能を搭載 よりリアルな人の声を再現
LINEヤフーは7月16日、カーナビアプリ「Yahoo!カーナビ」において生成AIを活用した音声案内機能の提供を開始した。より人に近い音声となったことで、音声を聞き取りにくいユーザーにも聞き取りやすくなったり、聞き間違えなどによる判断・認識のしづらさ、使いづらさを軽減したりする効果がある。(2024/7/18)
「Yahoo!カーナビ」にオンデバイスの音声生成AI搭載 ルート案内、聞き取りやすく
カーナビアプリ「Yahoo!カーナビ」(iOS/Android)のルート案内に、オンデバイス音声生成AIを採用。(2024/7/17)
Yahoo!カーナビ、音声案内に音声生成AIを採用 自然な発話で聞き取りやすさが向上
カーナビアプリ「Yahoo!カーナビ」は、オンデバイス音声生成AIを搭載した音声案内を提供開始。声の抑揚や感情、発音の細かなニュアンスまで再現し、より人の発話に近い音声を提供して聞き間違えなどを軽減するという。(2024/7/16)
PR:「ああ、松田優作に使ってほしい」 令和の渋谷駅に登場したAQUOSの広告がZ世代にもグッと来る
「オフィス作」&妻の美由紀さんがクリエーティブスーパーバイザーとして監修した、松田優作さんの“新作”映像も公開中。(提供:シャープ株式会社)(2024/7/16)
1秒の音声をわずか0.1秒で合成:
21言語のニューラル音声合成技術、NICTが開発
情報通信研究機構(NICT)は2024年6月、スマホ上でも高速動作が可能な21言語の高品質ニューラル音声合成技術を開発した。1つのCPUコアで、1秒の音声を0.1秒で合成できる。既存モデルに比べ約8倍の速さだという。(2024/7/8)
角刈りオジサンから美少女ボイス 「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた
「みんな〜〜〜私のこと見えてるぅ〜〜〜?」――出版社やIPホルダー、映像・CG、先端技術を持つコンテンツ関連企業が集結する「コンテンツ東京」(7月3日から5日まで東京ビッグサイトで開催)を物色していたら、遠くのブースからえらくキャピキャピした声が聞こえてきた。「どこかの企業がゲストでも呼んだのかな?」と覗いてみると、声の主は角刈りのオジサンだった。(2024/7/3)
製造マネジメント メルマガ 編集後記:
「原稿読み上げプレゼン」は機械に任せた方が合理的?
さまざまな観点で検証は必要ですが、今後広まっていく可能性も秘めています(2024/7/1)
エディタタブのマルチセレクトが可能に:
「Visual Studio Code」バージョン1.90リリース 「GPT-4」Copilot Chatモデルへのアクセスなど機能追加
MicrosoftはVisual Studio Codeのバージョン1.90をリリースした。本記事では追加されたエディタタブのマルチセレクトやGitHub Copilot Chatとのチャット機能などを紹介する。(2024/6/26)
エーアイ、「琴葉茜」に関する問い合わせについて声明 「個別に回答はしない」 ガイドライン順守呼びかけ
エーアイは21日、音声作成ソフト「A.I.VOICE 琴葉 茜・葵」の琴葉茜について「現在、多くの問い合わせを受けている」として声明を発表した。(2024/6/21)
ボカコレ運営、投稿者による交換条件としての相互「いいね」に注意喚起 「本来の主旨とは外れたもの」
ボカロ文化の祭典「The VOCALOID Collection」を運営するドワンゴは6月4日、投稿者同士が、投稿作品の内容に関係なく交換条件として互いの作品に「いいね」などのリアクションをする行為を確認したとして注意喚起した。(2024/6/5)
「AIと共存すべき」人気声優・梶裕貴 自身の声で自由にしゃべれるAIソフト発売へ 「たくさん悩んで」決断
「正直、たくさん悩みました」――人気声優の梶裕貴さんが、自身の声で自由にしゃべらせることができる音声合成ソフトを製品化すると発表した。(2024/5/28)
工場スマート化の今:
スマートファクトリーとAI、ChatGPT-4oの衝撃と可能性
世界の産業界でIoT(モノのインターネット)やロボット、AI(人工知能)などを活用したスマートファクトリー化が進んでいる。その流れの中で何が起きているのか、Beckhoff Automation(日本法人) 代表取締役社長の川野俊充氏に話を聞いた。(2024/5/28)
あのキャラの声、AIで勝手に再現「無断AIカバー」氾濫 声優と弁護士に聞く「声の守り方」と未来
人気声優や歌手の声を無断で使った「AIカバー」が急増。対策は? AI時代の声の未来は? 声優と弁護士に聞いた。(2024/5/10)
I will make you Miku Miku♪:
「初音ミク」の米国ライブを見て、「AIは人間の音楽も変えるのでは」と思った
ネギを振り回していたあの娘が、米国の大舞台で歌う日が来るなんて!(2024/4/30)
メリットも多いが、悪用リスクも:
OpenAIが開発した音声生成モデル「Voice Engine」が見せた実力と課題
OpenAIは音声生成モデル「Voice Engine」の小規模プレビューから得られた予備的な知見と結果を公表した。このプレビューから合成音声生成の持つ可能性と課題が浮き彫りとなった。(2024/4/20)
「スナックバス江」の“謎のYouTubeアニメ”が話題 原作者が爆速で拡散、しかし関係性は不明
「スナックバス江」の自主制作アニメがYouTube上に突如投稿され、Xなどで話題になっている。YouTubeに投稿されたアニメは合成音声などを使っており、テレビアニメとの関連は不明だが、原作者・フォビドゥン澁川さん本人が自身のXで取り上げている。(2024/4/10)
Galaxy S24シリーズの目玉機能「Galaxy AI」を全方位で検証 スマホ体験が大きく拡張される!
Galaxy AIの(ほぼ)全機能をスマホでレビュー。通話翻訳や文字起こし、要約……多彩な新機能を徹底解説する。(2024/4/11)
石野純也のMobile Eye:
「Galaxy AI」を打ち出すサムスンの端末戦略を解説 AI対応が“処理能力”だけで決まらないワケ
サムスン電子は、4月11日にフラグシップモデルの「Galaxy S24」「Galaxy S24 Ultra」を発売する。最大の特徴は、Googleの「Gemini Pro」や「Gemini Nano」などをAIモデルのベースにした「Galaxy AI」を端末の機能として密接に統合しているところにある。一方で、Galaxy AI自体はGalaxy S24/S24 Ultraだけでなく、アップデートを通じて過去のモデルにも適用される。(2024/4/6)
OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
OpenAIは、人の声を再現する生成AIモデル「Voice Engine」を発表した。動画生成の「Sora」同様「重大なリスク」があることを認識しており、広範囲に提供は(当面は)しない。(2024/3/30)
突然ブームになった「好きな惣菜発表ドラゴン」とは? ほっこりするニコ動の動画、作者に制作のきっかけを聞く
2023年8月にニコニコ動画に投稿された動画がブームに。(2024/3/28)
HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」 自然な会話はどう実現? 創業者に聞く
自然な会話が話題のおしゃべりAI「Cotomo」。開発の背景や目指すビジネスモデルを創業者に聞いた。(2024/3/29)
動画の一括編集、データ分析に役立つ:
YouTube運営がもっと楽に? 「YouTubeLabs」で自動化を支援するスクリプトを提供、Google
GoogleはGitHub上に「YouTubeLabs」を立ち上げ、パートナーやクリエイターの作業効率化を支援するスクリプトを公開した。これにより一般的なユースケースの自動化が可能になる。本記事ではYouTubeLabsの概要を紹介する。(2024/3/2)
セキュリティニュースアラート:
AI時代の要注意脅威アクターとは? Microsoftが調査レポート「Cyber Signals」を公開
MicrosoftはAIの登場によってサイバーセキュリティが大きな変革を迎えているとし、AIを使った攻撃対処や人材不足への対応など新たな取り組みを「Cyber Signals」第6版において伝えた。(2024/2/19)
深層学習モデルの仕組み【前編】
画像認識や生成技術の基礎「CNN」「GAN」とは? 押さえたい特徴と違い
主要な深層学習モデルとして「畳み込みニューラルネットワーク」(CNN)と「敵対的生成ネットワーク」(GAN)がある。両者には似通う点があるが、仕組みや使い方は異なる。その成り立ちから解説する。(2024/2/19)
データサイエンスのモデル入門【第1回】
ギャンブルが起源「データサイエンス」の基礎が分かる“4つの予測モデル”とは?
データ駆動型の意思決定がビジネスに欠かせなくなった。企業は予測モデルを構築してシミュレーションを重ねることで、深い洞察を得ることができる。代表的な4つのモデルについて、その起源や特徴を解説する。(2024/2/14)
IIFES 2024:
日立産機が“設備コンシュルジュ”を参考出展、生成AIとIoTサービスを組み合わせ
日立産機システムは、「IIFES 2024」において、生成AIとIoT接続による遠隔設備監視が可能な「FitLiveサービス」の組み合わせによる、設備コンシェルジュサービスを参考出展した。社内での実証を経て、2024年度以降の市場投入を検討している。(2024/2/2)
AIと恋愛できるiOSアプリ「恋するAI」 マッチングアプリ「タップル」提供元が開発 「少子化問題を解決したい」
AIと恋愛できるiOSアプリ「恋するAI」登場 マッチングアプリ「タップル」提供元が開発 「少子化問題を解決したい」 (2024/1/15)
AI活用で“電話予約対応”をどう変革した? ある和食チェーンの挑戦
和食・しゃぶしゃぶチェーン店「かごの屋」を運営するKRフードサービスが、ボトルネックになっていた電話予約対応業務の改善により、売上向上とコスト削減、業務負担減を成功させた。(2024/2/1)
歌声合成にダークホース? 「ペッパー」が、AI歌声合成ソフト「VoiSona」の新ボイスに登場
AI歌声合成ソフトを手掛けるテクノスピーチは、AI技術で人間の歌声を再現できるソフト「VoiSona」に、人型ロボット「Pepper」のボイスライブラリを追加した。(2024/1/11)
Gartner Insights Pickup(332):
AIベースのマシンが顧客になる未来に備える
この先、AIベースのマシンカスタマー(顧客としてのマシン)は増加し、洗練され、強力で独立した意思決定者、取引者となる見通しだ。本稿では、ビジネスリーダーに向けて、マシンカスタマーを引きつける5つの方法を紹介しよう。(2024/1/5)
Microsoftが「Azure AI」に新機能投入【後編】
NVIDIA、OpenAIとコラボするMicrosoft「Azure強化」の中身とは
Microsoftは2023年11月、AI技術に関する新サービスや新機能を相次いで発表した。同社がNVIDIAとの連携を強化して取り組もうとする「Microsoft Azure」のサービス強化などのアップデート情報を取り上げる。(2024/1/4)
Innovative Tech:
装着していないVRヘッドセットが"動く対話ロボット”に 置き台ごと変形 北海道大「OMEME」開発
北海道大学のヒューマンコンピュータインタラクション研究室に所属する研究者らは、VRヘッドマウントディスプレイ(HMD)を置くと置き台ごと動くコンパニオンロボットになるシステムを提案した研究報告を発表した。(2023/12/28)
Gartner Insights Pickup(330):
マシンカスタマーとは? どう対応すべきか
顧客が人間であることは当たり前に思えるが、顧客が人間ではなくなったらどうなるだろうか? 既に、AIによる人間以外の顧客が何らかの形で存在している。その利用に向けた準備を整えるべき時だ。(2023/12/15)
「イナズマイレブン」「妖怪ウォッチ」で画像生成AIを活用 レベルファイブのAI利用例が公開に
「イナズマイレブン」「レイトン教授」シリーズなどで知られるゲーム会社・レベルファイブは、画像生成AIの業務利用例を紹介した資料を公開した。(2023/12/12)
Innovative Tech:
人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール 合成音声に使われないために保護
米セントルイス・ワシントン大学に所属する研究者らは、自分の声が音声合成されないための防御ツールを提案した研究報告を発表した。(2023/12/11)
「クレデンシャルをSlackに書くな高校校歌」freeeが公開 なぜ作った
ああクレデンシャルをSlackに書くな高校、創設の歴史──。(2023/12/6)
Innovative Tech:
「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査
NTT社会情報研究所と慶應義塾大学の研究者らは、音声合成技術によって生成された、本人の声と酷似した合成音声が利用される場面において主張しうる権利について、著作権、パブリシティ権、個人情報の観点からの解釈を探求した研究報告を発表した。(2023/11/22)
Gartner Insights Pickup(326):
公共機関における生成AI利用の意義と課題
公共機関はAI(人工知能)技術への理解を徐々に深めており、サービス提供の改善に向けて投資を増やしている。だが、「ChatGPT」のようなモデルによる生成AIの台頭に伴う課題が生じており、新たなマインドセットが必要とされている。(2023/11/17)
HW構成で開発工数を大幅に削減:
xEV車に向けたAVAS専用の音声合成LSIを開発
ロームグループのラピステクノロジーは、xEV車に向けたAVAS(車両接近通報装置)専用の音声合成LSI「ML22120xx」を開発した。ハードウェア構成のため、マイコン応用のシステムに比べ、開発工数や期間を大幅に短縮できるという。(2023/11/15)
セキュリティニュースアラート:
OpenAI、ChatGPTのメジャーアップデート発表も直後に3度の障害 DDoS攻撃関与か?
OpenAIはGPT-4 Turboモデルを含むサービスのメジャーアップデートを発表した。しかしその後すぐに3度の障害発生を報告し、最後の障害についてはDDoS攻撃によるものだったと伝えている。(2023/11/13)
にわかに地球規模のトピックとなった新型コロナウイルス。健康被害も心配だが、全国規模での臨時休校、マスクやトイレットペーパーの品薄など市民の日常生活への影響も大きくなっている。これに対し企業からの支援策の発表も相次いでいるが、特に今回は子供向けのコンテンツの無料提供の動きが顕著なようだ。一方産業面では、観光や小売、飲食業等が特に大きな影響を受けている。通常の企業運営においても面会や通勤の場がリスク視され、サーモグラフィやWeb会議ツールの活用、テレワークの実現などテクノロジーによるリスク回避策への注目が高まっている。