論文PDFファイルの可読性を劇的に向上させるGoogle公式Chrome拡張機能「Google Scholar PDF Reader」レビュー

科学論文のPDFファイルを読みやすくするChrome拡張機能「Google Scholar PDF Reader」をGoogleが公開しました。論文の内容読解にめちゃくちゃ役立ちそうだったので、インストール手順や搭載機能をまとめてみました。続きを読む……
紹介論文PDFファイルの可読性を劇的に向上させるGoogle公式Chrome拡張機能「Google Scholar PDF Reader」レビューの続きを読む

コピペ禁止の入力フォームでコピペを可能にする拡張機能「Don’t F*** With Paste」レビュー

ウェブサイトの中にはアカウント作成画面やログイン画面などの入力フォームを「コピペ禁止」に設定しているものがあります。ブラウザ拡張機能「Don’t F*** With Paste」を使えば「コピペ禁止」を回避できるとのことなので、実際に使ってみました。続きを読む……
紹介コピペ禁止の入力フォームでコピペを可能にする拡張機能「Don’t F*** With Paste」レビューの続きを読む

画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー

Teedyはさまざまな種類のファイルの中身を読み取って検索できる状態にしてくれるドキュメント整理ツールです。受信したメールを自動で取り込む設定もできるとのことなので、実際にセルフホストして使い勝手を確かめてみました。続きを読む……
紹介画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビューの続きを読む

無料で使えるオープンソースのデスクトップ環境「Puter」レビュー

GitHubでオープンソースプロジェクトとして公開されている「Puter」は、高速で機能が豊富、かつ拡張性が高いことが特徴のブラウザベースのデスクトップ環境で、Google DriveやDropboxに代わるクラウドストレージやリモートの仮想デスクトップとして使うこともできます。一体どんな使い勝手なのか気になったので、実際に触ってみました。続きを読む……
紹介無料で使えるオープンソースのデスクトップ環境「Puter」レビューの続きを読む

Stability AIが画像から3Dモデルを生成できるAI「TripoSR」を発表、簡単に使えるデモも公開されてたので試してみた

2024年3月5日、画像生成AI「Stable Diffusion」などの開発を行うStablity AIが、3Dモデル生成AIツール「Tripo AI」を開発するTripoと提携し、画像を入力するだけで高品質な3Dモデルを生成できるAIツール「TripoSR」を発表しました。続きを読む……
紹介Stability AIが画像から3Dモデルを生成できるAI「TripoSR」を発表、簡単に使えるデモも公開されてたので試してみたの続きを読む

大規模言語モデルの動作をExcelで完全に再現することでプログラミングをせずにAIの構造を学習できるシートが登場

OpenAIのChatGPT、AnthropicのClaude、GoogleのGemini、MetaのLlamaなどさまざまなAIが驚異的なスピードで登場し、日々の生活や仕事で実際に使う人も増加しているはず。しかし、AIの構造を学ぼうとするとどうしてもプログラミングの知識が必要でした。「Spreadsheets are all you need.ai」はAIの構造をExcelの形式に落とし込むこと…
紹介大規模言語モデルの動作をExcelで完全に再現することでプログラミングをせずにAIの構造を学習できるシートが登場の続きを読む

Google ChromeにGeminiを統合するオプションが開発者向けのChrome Canaryに登場

Google Chromeの開発者向けビルドであるChrome Canaryには将来のChromeに搭載される予定の最先端の機能が搭載されています。そうした開発中の機能の中に、ChromeとAIモデルのGeminiを統合する機能がひっそりと追加されたことが明らかになりました。続きを読む……
紹介Google ChromeにGeminiを統合するオプションが開発者向けのChrome Canaryに登場の続きを読む

無料でYouTubeを広告や追跡なしで見ることができるオープンソースアプリ「NewPipe」をインストールしてみた

「NewPipe」は、煩わしい広告なしでYouTubeやPeerTubeなどの動画共有サービスを利用できるオープンソースのアプリです。GoogleのライブラリやYouTubeのAPIを使用しておらず、YouTubeアカウントでのログインも不要だというNewPipeを実際にAndroidスマートフォンに導入してみました。続きを読む……
紹介無料でYouTubeを広告や追跡なしで見ることができるオープンソースアプリ「NewPipe」をインストールしてみたの続きを読む

無料でEPUBやPDFのほか7万以上の書籍を自由に読めてWindows・Linux・macOSなどで同期できる電子書籍リーダー「Librum」レビュー

オープンソースの電子書籍リーダーソフト「Librum」は、PDFや電子書籍ファイルであるEPUB・MOBIのデータを読み込んで本棚として共有できるほか、7万冊以上の無料書籍を自由にダウンロードして複数端末で読書進度も合わせて共有できます。続きを読む……
紹介無料でEPUBやPDFのほか7万以上の書籍を自由に読めてWindows・Linux・macOSなどで同期できる電子書籍リーダー「Librum」レビューの続きを読む

大規模言語モデルを動作させる時に必要なVRAMの使用量を推定してくれる「VRAM Estimator」

大規模言語モデルを動作させるには、演算処理にGPUを使用するため、グラフィックスメモリ(VRAM)の容量が重要になります。「VRAM Estimator」はさまざまなモデルで必要となるVRAMの容量をシミュレーションで予測するウェブアプリです。続きを読む……
紹介大規模言語モデルを動作させる時に必要なVRAMの使用量を推定してくれる「VRAM Estimator」の続きを読む

WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー

ページに挿入する画像の形式として「WebP」や「AVIF」を採用するウェブサイトが増えつつあります。しかし、画像ビューワや画像編集ソフトの中にはWebPやAVIFに対応していないものも多く、「ウェブページから画像をダウンロードしたものの、WebP形式の画像だったから編集ソフトやビューワで開けない」といった状況に遭遇した経験がある人も多いはず。ブラウザ向けの拡張機能「WebP / Avif imag…
紹介WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビューの続きを読む

Microsoft OfficeのWord・Excel・PowerPointをVR/MR空間で使えるMeta Quest向けのアプリが無料で公開される

Microsoftが、Meta Quest/Quest 2/Quest Pro/Quest 3向けに、Microsoft OfficeスイートのうちのWord・Excel・PowerPointの3アプリを無料公開しました。VR(仮想現実)あるいはMR(混合現実)空間で、Microsoft Officeの基本ツール3種を使うことができます。続きを読む……
紹介Microsoft OfficeのWord・Excel・PowerPointをVR/MR空間で使えるMeta Quest向けのアプリが無料で公開されるの続きを読む

わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法

「llamafile」は大規模言語モデルのモデルやウェイトの情報が1つの実行ファイルにまとまった形式のファイルです。Linux・macOS・Windows・FreeBSD・NetBSD・OpenBSDという6つのOS上でインストール不要で大規模言語モデルを動作させることが可能とのことなので、実際にWindowsおよびLinuxディストリビューションの1つであるDebian上で動かしてみました。続き…
紹介わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法の続きを読む

Wikipediaの全記事をSDカードやUSBメモリに詰め込んで持ち運べる「Kiwix」の使い方まとめ

オンライン百科事典「Wikipedia」は調べ物をする際に有用なサービスですが、「インターネットに接続しないと閲覧できない」という問題も存在します。「Kiwix」はWikipediaなどのオンライン上のデータをローカルに保存していつでも閲覧可能にするアプリで、Windows、macOS、Linux、iOS、Androidなど各種OSで使用可能とのこと。データ通信量を削減しつつWikipediaを閲…
紹介Wikipediaの全記事をSDカードやUSBメモリに詰め込んで持ち運べる「Kiwix」の使い方まとめの続きを読む

画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた

Microsoftやウィスコンシン大学マディソン校などの研究チームが開発し、2023年4月17日に公開した「LLaVA」は「視覚」を持つAIで、画像を入力するとその画像に基づいて返答を行うことができます。2023年10月5日に登場したLLaVA-1.5はさらにクオリティが向上しているとのことなので、実際にGoogleのクラウドコンピューティングサービス「Google Cloud Platform(…
紹介画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみたの続きを読む