Stability AIが画像から3Dモデルを生成できるAI「TripoSR」を発表、簡単に使えるデモも公開されてたので試してみた

2024年3月5日、画像生成AI「Stable Diffusion」などの開発を行うStablity AIが、3Dモデル生成AIツール「Tripo AI」を開発するTripoと提携し、画像を入力するだけで高品質な3Dモデルを生成できるAIツール「TripoSR」を発表しました。続きを読む……
紹介Stability AIが画像から3Dモデルを生成できるAI「TripoSR」を発表、簡単に使えるデモも公開されてたので試してみたの続きを読む

大規模言語モデルの動作をExcelで完全に再現することでプログラミングをせずにAIの構造を学習できるシートが登場

OpenAIのChatGPT、AnthropicのClaude、GoogleのGemini、MetaのLlamaなどさまざまなAIが驚異的なスピードで登場し、日々の生活や仕事で実際に使う人も増加しているはず。しかし、AIの構造を学ぼうとするとどうしてもプログラミングの知識が必要でした。「Spreadsheets are all you need.ai」はAIの構造をExcelの形式に落とし込むこと…
紹介大規模言語モデルの動作をExcelで完全に再現することでプログラミングをせずにAIの構造を学習できるシートが登場の続きを読む

Google ChromeにGeminiを統合するオプションが開発者向けのChrome Canaryに登場

Google Chromeの開発者向けビルドであるChrome Canaryには将来のChromeに搭載される予定の最先端の機能が搭載されています。そうした開発中の機能の中に、ChromeとAIモデルのGeminiを統合する機能がひっそりと追加されたことが明らかになりました。続きを読む……
紹介Google ChromeにGeminiを統合するオプションが開発者向けのChrome Canaryに登場の続きを読む

無料でYouTubeを広告や追跡なしで見ることができるオープンソースアプリ「NewPipe」をインストールしてみた

「NewPipe」は、煩わしい広告なしでYouTubeやPeerTubeなどの動画共有サービスを利用できるオープンソースのアプリです。GoogleのライブラリやYouTubeのAPIを使用しておらず、YouTubeアカウントでのログインも不要だというNewPipeを実際にAndroidスマートフォンに導入してみました。続きを読む……
紹介無料でYouTubeを広告や追跡なしで見ることができるオープンソースアプリ「NewPipe」をインストールしてみたの続きを読む

無料でEPUBやPDFのほか7万以上の書籍を自由に読めてWindows・Linux・macOSなどで同期できる電子書籍リーダー「Librum」レビュー

オープンソースの電子書籍リーダーソフト「Librum」は、PDFや電子書籍ファイルであるEPUB・MOBIのデータを読み込んで本棚として共有できるほか、7万冊以上の無料書籍を自由にダウンロードして複数端末で読書進度も合わせて共有できます。続きを読む……
紹介無料でEPUBやPDFのほか7万以上の書籍を自由に読めてWindows・Linux・macOSなどで同期できる電子書籍リーダー「Librum」レビューの続きを読む

大規模言語モデルを動作させる時に必要なVRAMの使用量を推定してくれる「VRAM Estimator」

大規模言語モデルを動作させるには、演算処理にGPUを使用するため、グラフィックスメモリ(VRAM)の容量が重要になります。「VRAM Estimator」はさまざまなモデルで必要となるVRAMの容量をシミュレーションで予測するウェブアプリです。続きを読む……
紹介大規模言語モデルを動作させる時に必要なVRAMの使用量を推定してくれる「VRAM Estimator」の続きを読む

WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー

ページに挿入する画像の形式として「WebP」や「AVIF」を採用するウェブサイトが増えつつあります。しかし、画像ビューワや画像編集ソフトの中にはWebPやAVIFに対応していないものも多く、「ウェブページから画像をダウンロードしたものの、WebP形式の画像だったから編集ソフトやビューワで開けない」といった状況に遭遇した経験がある人も多いはず。ブラウザ向けの拡張機能「WebP / Avif imag…
紹介WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビューの続きを読む

Microsoft OfficeのWord・Excel・PowerPointをVR/MR空間で使えるMeta Quest向けのアプリが無料で公開される

Microsoftが、Meta Quest/Quest 2/Quest Pro/Quest 3向けに、Microsoft OfficeスイートのうちのWord・Excel・PowerPointの3アプリを無料公開しました。VR(仮想現実)あるいはMR(混合現実)空間で、Microsoft Officeの基本ツール3種を使うことができます。続きを読む……
紹介Microsoft OfficeのWord・Excel・PowerPointをVR/MR空間で使えるMeta Quest向けのアプリが無料で公開されるの続きを読む

わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法

「llamafile」は大規模言語モデルのモデルやウェイトの情報が1つの実行ファイルにまとまった形式のファイルです。Linux・macOS・Windows・FreeBSD・NetBSD・OpenBSDという6つのOS上でインストール不要で大規模言語モデルを動作させることが可能とのことなので、実際にWindowsおよびLinuxディストリビューションの1つであるDebian上で動かしてみました。続き…
紹介わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法の続きを読む

Wikipediaの全記事をSDカードやUSBメモリに詰め込んで持ち運べる「Kiwix」の使い方まとめ

オンライン百科事典「Wikipedia」は調べ物をする際に有用なサービスですが、「インターネットに接続しないと閲覧できない」という問題も存在します。「Kiwix」はWikipediaなどのオンライン上のデータをローカルに保存していつでも閲覧可能にするアプリで、Windows、macOS、Linux、iOS、Androidなど各種OSで使用可能とのこと。データ通信量を削減しつつWikipediaを閲…
紹介Wikipediaの全記事をSDカードやUSBメモリに詰め込んで持ち運べる「Kiwix」の使い方まとめの続きを読む

画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた

Microsoftやウィスコンシン大学マディソン校などの研究チームが開発し、2023年4月17日に公開した「LLaVA」は「視覚」を持つAIで、画像を入力するとその画像に基づいて返答を行うことができます。2023年10月5日に登場したLLaVA-1.5はさらにクオリティが向上しているとのことなので、実際にGoogleのクラウドコンピューティングサービス「Google Cloud Platform(…
紹介画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみたの続きを読む

GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー

文章生成AIの研究開発が急速に進んでおり、無料で使える大規模言語モデル(LLM)も数多く公開されています。しかし、LLMの動作を実際に試すには高性能なハードウェアや複雑な環境構築が必要なことが多いため、最初から諦めている人も多いはず。無料で公開されている「LM Studio」を使えば、一般的な性能のPCでもコマンド不要で気軽にLLMの動作させられるとのことなので、実際にLM Studioを使ってL…
紹介GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビューの続きを読む

中国アリババがチャットAI「Qwen-72B」とローカルで音声入力に対応する「Qwen-Audio」をオープンソースで公開

中国の大手IT企業であるアリババが、720億のパラメーター数を誇るTransformerベースの大規模言語モデル「Qwen-72B」と、日本語の音声入力にも対応したQwenのマルチモーダルバージョンの「Qwen-Audio」をオープンソース化したことを発表しました。続きを読む……
紹介中国アリババがチャットAI「Qwen-72B」とローカルで音声入力に対応する「Qwen-Audio」をオープンソースで公開の続きを読む

インターネット上の最新情報を収集して最近の話題に対応できる大規模言語モデル「pplx-7b-online」&「pplx-70b-online」が公開されたので性能を確かめてみた

ChatGPTなどのチャットAIに「野球の試合結果」「昨日の天気」などの情報を聞くと、「最新情報は学習していないので答えられない」という旨の回答が返ってきます。AI開発企業のPerplexityが開発した大規模言語モデル(LLM)「pplx-7b-online」と「pplx-70b-online」は、インターネット上の情報を収集して最新情報に沿った質問に回答できるとのこと。すでに両モデルを無料で使…
紹介インターネット上の最新情報を収集して最近の話題に対応できる大規模言語モデル「pplx-7b-online」&「pplx-70b-online」が公開されたので性能を確かめてみたの続きを読む

ChatGPTを超えるという大規模言語モデル「OpenChat」をローカルで動作させて実力を確かめてみた

OpenChatはオープンソースの大規模言語モデルです。OpenChatのうち2023年11月にリリースされたOpenChat-3.5-7Bモデルはパラメーター数が70億しかないにもかかわらず2023年3月時点のChatGPTを超えるベンチマーク結果を出すほど性能が高いモデルとのことなので、実際に使って試してみました。続きを読む……
紹介ChatGPTを超えるという大規模言語モデル「OpenChat」をローカルで動作させて実力を確かめてみたの続きを読む