- RaspiGPT は、チャット、会話管理、ストリーミング応答を備えた Raspberry Pi 上のシンプルな Web アシスタントを紹介します。
- ASRAI は、Meshnet 経由でアクセス可能な OpenAI 互換 API (Ollama) を介して、ローカル VOSK と LLM を組み合わせます。
- Raspberry Pi 5とHailo-8L(13 TOPS)を搭載したAIキットにより、Raspberry Pi OSと統合された効率的なエッジAIが可能になります。
- セキュリティ: アップデート、分離された IoT ネットワークと暗号化、音声アシスタントとチャット用の STT/TTS および NLP オプション。

言語モデルの台頭により、AIはあらゆるメーカーにとって手の届くものとなり、Raspberry Piは実験に最適な場となっています。この記事では、PiCockpitを使ったチャット風ウェブアシスタント、Raspberry Pi 4を使ったプライベート音声アシスタント、そしてRaspberry Pi 5とそのAIキットを使った強力なオプションなど、実際のプロジェクトがどのように構築されたかを詳しくご紹介します。 どの部分が組み合わさるのか、どのようなハードウェアとソフトウェアが必要なのか、そしてどのようなパスをたどることができるのかを確認することが目的です。 クラウドベース、ハイブリッド、オフラインのどれを希望するかによって異なります。
必要なものがすべて揃っていることを確認するために、依存関係 (Node.js、npm、yarn) のインストール、キーの構成、インターフェイスの実行と使用、VOSK によるローカル音声認識、OpenAI タイプの API (Ollama 経由) を介したモデルとの統合、Hailo-8L NPU によるアクセラレーションまで、すべてをカバーします。 また、サイバーセキュリティに関する考慮事項、プロジェクトを軌道に乗せるためのチーム管理の概要、実際の例についても説明します。 異なる世代の Raspberry Pi で。
Raspberry Pi で AI アシスタントは何ができるでしょうか?
Raspberry Pi アシスタントは、質問に答えたり、ローカルアクションを実行したり、デバイスを制御したり、自然な応答で音声エントリ ポイントになったりすることができます。 実際には、ウェブベースのチャットと音声起動アシスタントという2つの主なアプローチがあります。クラウド コンピューティング オプションを使用して、自社ネットワーク上または 100% オンプレミスで実行できます。
PiCockpit 用の RaspiGPT などの Web バリアントでは、会話管理と言語モデルへの呼び出しを備えたチャット インターフェイスがあります。 ASRAI プロジェクトなどの音声ベースのバリアントでは、マイク、ローカル音声認識、API アクセス可能な LLM が組み合わされています。トンネルやプライベート ネットワーク経由で別のマシンからでもアクセス可能です。
PiCockpitのRaspiGPT:チャットのようなAIアシスタント
PiCockpit チームは、Raspberry Pi と関連技術トピックに関する質問に答えるために設計された、RaspiGPT というシンプルなアプリを開発しました。 インターフェースには、テキスト領域と、チャットの名前変更、報告、削除、または新規作成を行うためのボタンがあります。物事を複雑にすることなく、快適な会話をするには十分です。
RaspiGPT の鍵は、セットアップが簡単で、メッセージ入力、モデル呼び出し、リアルタイム ストリーミング応答などの基本をカバーしていることです。 モデルがコンテンツを生成すると、少しずつ表示されていきます。、エクスペリエンスを大幅に向上させます。
注意 独自のバージョンを展開するには、OpenAI API キーが必要です。 その資格情報がないとセットアップを完了できません アプリは応答しなくなります。
依存関係のインストール(Raspberry Pi 4 またはその他のシステム)
オリジナルのデモはRaspberry Pi 4で動作しますが、Node.jsを搭載したシステムであればどこでも同様に動作します。プロセスは、プロジェクトリポジトリのクローンを作成し、環境を準備することから始まります。 Node.js、npm、yarnパッケージマネージャーをインストールする必要があります。お使いのプラットフォームに適したビルドをダウンロードしてください。
Raspberry Pi 4をお使いの場合、ダウンロードはARMv8用です。ファイルを入手したら、通常の手順で解凍してインストールし、すべてが正しく動作することを確認してください。 ノードとnpmのバージョンをチェックして、インストールでエラーが発生していないことを確認します。 アプリを続行する前に。
重要な点として、ダウンロードしたバージョンに応じてファイル名が変更される可能性があるため、コマンドで置き換えるときは注意してください。 何か問題が発生した場合、プロジェクトの README では通常、追加の手順や解決策が提供されます。 典型的なケースの場合。
Node.js と npm の準備ができたら、yarn をインストールして、環境の最後の部分を準備します。 そこからアプリケーションの構築と実行に進むことができます 完全に正常です。
RaspiGPTの構築と設定
リポジトリのクローンを作成したら、最小構成を行います。OpenAI アカウントで API キーを作成し、プロジェクトで参照します。 キー(例えば「RaspiGPT-Key」)を生成し、慎重にコピーします。 すぐに必要になるからです。
そのキーは、フレームワークの構成ファイルの対応する行 (この場合は「nuxt.config.ts」) に貼り付けられます。 その変数が適切に定義されていない場合、モデルへの呼び出しは認証されません。したがって、これは重要なステップです。
ウィザードを実行してインターフェースを使用する
依存関係がインストールされ、キーが設定されたら、あとはサービスをビルドして実行するだけです (「gpt-demo」ディレクトリ内にいることを確認してください)。 アプリを起動すると、ローカルにホストされ、ブラウザで「http://localhost:3000」で開くことができます。 会話を始める。
アシスタントはストリーミングで応答するため、やり取りがはるかにスムーズになります。AI が入力している間に読むことができます。 さらに、インターフェース自体からチャットを管理(名前の変更、報告、削除、作成)することもできます。 バックエンドには一切触れずに。
オリジナルプロジェクトには、後日公開予定のデモ動画が含まれており、実際の動作を確認するのに役立ちます。 それまでは、アプリは非常にシンプルなので、数分で使い方を習得できます。 コンピュータ上で実行したら。
ASRAI: Raspberry Pi 4 のプライベート音声アシスタント
もう一つの非常に興味深いアプローチは、アダム・フライドリッヒ氏が開発したASRAIです。ここで鍵となるのは音声です。システムはユーザーのプライバシーを尊重しながら、ユーザーの声を聞き、解釈し、応答します。 このセットアップでは、Raspberry Pi 4 Model B、3,5 インチ GPIO ディスプレイ、そして主力周辺機器である Sony PlayStation Eye カメラを使用します。.
なぜ PS Eye なのか?それは、カメラに加えて、取り外して Pi で使用できる 4 つのマイクが統合されているからです。 中古品でも非常に安価で、簡単に統合でき、十分以上のキャプチャ品質を提供します。 家のプロジェクトのために。
ソフトウェアでは、ASRAI は外部サービスに依存せずに、ローカル音声認識に VOSK を活用します。 言語モデルについては、Pi 自体で実行するのではなく、Ollama によって公開されている OpenAI 互換 API が使用されます。 ネットワーク上の別のマシン上。
NordVPN の Meshnet のおかげで、システムはチャネルをプライベートに保ちながら、どこからでも LLM サーバーと通信できます。 このハイブリッドアプローチ(ローカル音声+リモートLLM)は、遅延、プライバシー、電力のバランスをとります。家庭環境に非常によく適合します。
さらに、アシスタントの状態に応じて小さな画面に表示される「睡眠中」と「聞いている」画像も追加しました。 それを複製することに決めた場合、3D プリンターとはんだごてが必要になります。このデザインには多少の手先の器用さが求められるためです。
こうした方向のアイデアがお好きなら、Raspberry Pi を AI 機能を備えたアシスタントに変える実験や、さまざまなモデルをテストした Raspberry Pi 5 との比較もご覧いただけます。 コミュニティは急速に進化しており、専門メディアで参照情報が見つかります。 これらの設定について話します。
Raspberry Pi 5: アシスタントのためのパワーと接続性
Raspberry Pi 5 は、CPU やメモリが増設され、最新のバスが搭載されているため、前世代と比べて可能性が 2 倍になっていると言われています。 2,4GHz ARM Cortex-A76、最大8GBのLPDDR4X RAM、Wi-Fi 5、Bluetooth 5.0/BLEを搭載しています。、60 Hzで4KをサポートするデュアルマイクロHDMIビデオ出力。
これらの仕様により、完全なオペレーティング システムと軽量 AI フレームワーク、さらには自動化やマルチメディア プロジェクトも実行できます。 Python、Java、C++ でプログラミングし、センサーとアクチュエータを接続するのは簡単です。 Pi エコシステムを使用します。
Raspberry Pi 5 AIキット(Hailo-8L搭載)
さらに一歩進みたい場合は、Raspberry Pi 5用のAIキットで、M.2 HAT+を介してHailo-8L NPUを追加します。 このユニットは最大 13 TOPS まで到達でき、M.2 2242 形式で搭載されています。、差し込む準備完了。
パッケージには、M.2 HAT+、Hailo-8L を搭載したモジュール、スタック可能な GPIO ヘッダー、スペーサー、ネジ、Pi 5 の PCIe に接続するためのフラット ケーブルが含まれています。 ボードには温度を制御するためのヒートシンクも組み込まれています。 アクセルが全開のとき。
ハードウェアがインストールされると、ソフトウェアは Raspberry Pi OS 環境と統合され、libcamera、rpicam-apps、picamera2 がサポートされます。 Hailo、HailoRT、HailoTappasドライバはaptを使って簡単にインストールできます。奇妙なコンパイルと格闘することなく。
この AI キットは、エネルギー効率に優れた高性能 AI を Pi に導入するために設計されたシリーズの最初のキットです。 オブジェクト検出、顔認識、ローカルアシスタント、その他のエッジ AI アプリケーションに使用されます。 低遅延とプライバシーが求められるもの。
音声認識、NLP、合成:ソフトウェアオプション
音声コマンドをキャプチャするには、いくつかの選択肢があります。ローカル環境ではVOSKが信頼できる代替手段であり、PocketSphinxのようなエンジンもあります。クラウドサービスをお探しの場合は、外部プロバイダーに接続できるライブラリがあります。 Pythonでは、SpeechRecognitionライブラリはさまざまなバックエンドとの統合を容易にします。 STTから。
ユーザーの意図を理解するために、自然言語処理が役立ちます。 OpenAI タイプの API を介してアクセス可能な LLM は、セマンティック部分を簡素化します。クラウドベースのモデル、ネットワーク上で Ollama を使用して公開するモデル、あるいは Pi 5 で実行される最適化されたモデルなどです。
音声応答の場合、pyttsx3 はインターネットに依存しないテキスト音声合成オプションです。 これらのブロック(STT + LLM + TTS)を使用すると、完全な会話ループを構築できます。 Pi 上で実行されるか、別のマシンのサポートを受けて実行されます。
Raspberry Pi 5の実践的なケーススタディ:インストールとスクリプト
Pi 5 で何か最小限のものが欲しい場合は、Raspbian Lite のような軽量イメージをインストールすると、AI 用のリソースが解放されます。 次に、必要なライブラリ (SpeechRecognition や pyttsx3 など) を設定し、Python でスクリプトを作成します。 アシスタントのロジックを使用します。
このアプローチの利点は、トリガーワード、ダイアログフロー、システムアクション、デバイスなど、各部分をケースに合わせて調整できることです。 最終的には、Pi はローカル タスクを実行したり、接続された他のデバイスにコマンドを送信したりできるようになります。 Wi-Fi または Bluetooth 経由で。
100% Pi 5プロジェクト:小さいながらも便利なモデル
すべてを Raspberry Pi 5 自体で実行したい場合は、ボード上で完全に実行されるエージェントの実際の例があります。 注目すべき事例としては、Qwen3 1.7BやGemma3 1Bなどのコンパクトなモデルを使用し、トリガーワードの検出、転写、推論を行っている。 同じデバイス上で実行されています。
このタイプのプロジェクトは、最適化とモデルの縮小により、外部サポートなしで基本的な会話とツール制御が実行可能であることを示しています。 コードと公開ドキュメントを使用すると、アセンブリを複製し、パフォーマンスのコツを学ぶことができます。 それを可能にします。
オーディオハードウェア:マイクアレイが大きな違いを生む理由
キーワード起動アシスタントでは音声キャプチャが重要です。 ソニーのプレイステーションアイの4マイクアレイを再利用するのは安価で機能的なアイデアだ Raspberry Pi 4 ではすでにその有効性が実証されています。
優れたアレイとローカル STT エンジンを使用すると、ノイズが削減され、精度が向上し、ユーザーの理解にネットワークに依存する必要がなくなります。 シンプルなハードウェアと最適化されたソフトウェアの間のこのバランスこそが、メーカーのアプローチを非常に実用的なものにしているのです。 Pi について。
サイバーセキュリティとメンテナンス:見逃してはいけないこと
アシスタントがインターネットに接続する場合、セキュリティは重要です。システム、ライブラリ、依存関係を最新の状態に維持し、既知の脆弱性を軽減しましょう。 IoTデバイス用の隔離されたネットワークと暗号化された通信により、攻撃対象領域が縮小されます。 外部からの攻撃に直面して。
この文脈では Pi 5 のアシスタントに具体的にリストされている CVE はありませんが、一般的な IoT の問題を注意深く監視する価値はあります。 CVE-2021-22945やCVE-2021-22946などの脆弱性は、パッチ適用とレビューの重要性を思い出させるものである。 公開されているサービス。
プロジェクト管理:権限なしで影響を与え、チームをスムーズに動かす
AI アシスタントを他の人と協力して開発する場合、調整はコードと同じくらい重要です。 正式な権限は役立ちますが、信頼性、関係性、知名度の方が、多くの場合、より重要です。 依存関係のロックを解除するとき。
どのような組織にも政治、つまり異なる優先順位、プレッシャー、多様な視点が存在すると想定されています。 あなたの役割は、共感を持ってこれらの緊張を管理し、相互依存関係をマッピングし、信頼を構築することです。タイトルで押し付けるのではなく。
誰が協力する必要があるのか、誰が進捗を妨げる可能性があるのか、誰があなたの成果に依存しているのかを自問してください。 あなたが正しいことをしたいと思っており、その方法を知っており、それを達成できるということを周囲が認識するまで、あなたの影響力は限られます。たとえ課題がいかに技術的なものであっても。
最終的な飛躍は、「必要なものを手に入れる」から「共通の勝利を生み出す」へと移行することです。 この考え方の変化はコラボレーションとイノベーションを加速させるまさに AI アシスタントのような分野横断的なプロジェクトに必要なものです。
特に適するユースケース
Pi 5と、必要に応じてHailo-8L NPUを使用すると、ビジョンタスクとハイブリッドアシスタントに非常に簡単に取り組むことができます。 顔認識によるアクセス制御、研究室の仮想アシスタント、基本的な学習行動を備えたロボット これらは完全に実現可能なプロジェクトです。
携帯性を重視する場合は、VOSK とマイク アレイを搭載した Pi 4 を使用すると、クラウドに依存せずに優れた音声アシスタントを利用できます。 洗練されたチャット体験をお求めの場合は、RaspiGPT タイプの提案により、数分で必要なものが提供されます。、ブラウザから、ストリーミング応答で。
ハードウェア分野では、Hailo の AI キットにより加速の世界への参入が簡単になります。 ソフトウェアがapt用にパッケージ化されており、libcameraとpicamera2と統合されているため、摩擦が軽減されます。 モデルとユースケースに集中できるようになります。
ご覧いただいたコンポーネントを使用して、クラウド、ハイブリッド、ローカル、Web または音声、NPU 搭載の Pi 4 または Pi 5 などのパスを選択できます。 重要なのは、選択肢が現実のものであり、コミュニティ プロジェクトでテストされていることです。残っているのは構築を開始することだけです。