paint-brush
クリエイティブなのはAIか人間か?@michaelkwok
1,063 測定値
1,063 測定値

クリエイティブなのはAIか人間か?

Michael Kwok9m2023/04/30
Read on Terminal Reader

長すぎる; 読むには

受賞歴のある AI が生成した写真は、AI が創造的で審美的な作品において人間に取って代わることができるかどうか、再考するよう警告しています。
featured image - クリエイティブなのはAIか人間か?
Michael Kwok HackerNoon profile picture

The Electricianというタイトルのこの記事の主役の画像は、人工知能 (AI) の助けを借りて、写真家でアーティストの Boris Eldagsen によって作成された魅力的な芸術作品で、最近、Sony World Photography Awards で優勝しました


これは AI における重要な成果であり、分析ツールとしての従来の役割を超えて、美的創造性を生み出す可能性を示しています。


AlphaGo と象徴的な Deep Blue の勝利に先立つ完全な目新しさではありませんが、それでも重要であり、新しい時代の夜明けを示しています。


愛好家は、AI が創造性の未知の領域に拡大することを熱心に予見し、熱狂的な期待を抱いています。


それにもかかわらず、AI によって生成されたコンテンツの出現は、大規模な「コンピューター化された盗作」の前兆と見なす人もいるため、オリジナルのコンテンツ作成者の将来について懸念を引き起こしています。


多くの著作権訴訟が法廷での最終決定を待っていますが、この問題は依然として物議を醸しています。


テクノロジーが進歩するにつれて、創造的な追求における AI の使用に関して有意義な議論を行う必要があります。


AI が芸術や創造性に対する従来のアプローチを混乱させる可能性は否定できませんが、それが本当に人間の革新に匹敵するのか、それとも単により高度な形の盗作を表すだけなのかはまだわかりません。

生成型 AI ではなく、派生型、合成型 AI

剽窃は揺るぎないタブーです。この重大な不正行為へのコミットメントは、学術研究、音楽制作、記事の執筆、またはイメージ作成に関与しているかどうかにかかわらず、勤勉なクリエイターのキャリア全体に壊滅的な影響を与える可能性があります.


単語ごとまたはピクセルごとのコピーに限定されるだけでなく、コンテンツが単に言い換えられている場合、または構造が同じアーティファクトから操作されている場合にも適用できます。


剽窃の永続性は、インターネットからコピーできる膨大な量のデータ ソースにかかっています。


無制限の情報を記憶する人間の精神の有限能力を考えると、志願者は、盗用を容易にするために、高速なコンピューターと広大なローカルおよびクラウドストレージの助けを求めるかもしれません.


現在、ハードウェアの技術的進化に伴い、AI、より具体的には、新しいコンテンツを作成するジェネレーティブ AI モデルの開発が提供されています。


ジェネレーティブ AI モデルは、タイプに応じて、テキスト、画像、ビデオ クリップ、およびオーディオ トラックの膨大なコーパスから事前にトレーニングされます。


たとえば、Stable Diffusion のテキストから画像へのモデルは、 LAION 5Bのさまざまなサブセットでトレーニングされています。これは、約 60 億の CLIP フィルター処理された画像とテキストのペアを含む大規模なデータセットです。 DALL-E、Midjourney、Imagen などの他の競合モデルも同様です。


ソース画像は、ストック画像サイト、アート プリント、ポスター マーケットプレイスから、ソーシャル メディア プラットフォームやブログ投稿まで、多数のオンライン ドメインからクロールされます。


データを説明することで、モデルは広範囲に及ぶ説得力のある構造でサポートされます。新しいコンテンツは、数秒のテキスト プロンプトだけで複数の画像ソースから派生します。


興味があれば、 Stable Diffusion やその他のモデルの技術的ロジックをさらに研究することもできますが、これを新しいコンテンツの「生成」と見なすことが常に正確であるとは限らないことを説明したいと思います。


代わりに、これらのモデルは、人間が提供した既存のデータのプールから学んだことに基づいてコンテンツを合成します。


数十億の画像を1つずつ処理できない人間とは異なり、モデルは高度な計算能力を備えているため、膨大な量のデータを処理できます。


合成副産物の一部 (生成された画像) は、モデルが選択したソース データのため、ほとんどの人にとって非常に見慣れたものに見えます。それが有名な絵画であろうと、古典的なミームであろうと。


それどころか、一部のコンテンツは珍しくオリジナルに見える場合があります。


現時点では、ジェネレーティブ AI を合成するという性質によって損なわれているのは、その堅牢性にもかかわらず、マーケターの修辞的なスピーチです。適切なソース データ収集に関する活発な二分法は、「AI の創造性」が起源ではなく派生であることを意味します。


とはいえ、ジェネレーティブ AI の手ごわい組み合わせ能力は説得力があり、人々を AI の創造性として輝かせてきました。

AI クリエイティビティの 4 つの段階

AI クリエイティビティの本質を探求するうえで、人間の介入なしに AI がどの程度自律しているかは、私にとって客観的な評価基準の 1 つです。 AI の創造性は、関与の程度に応じて、次の 4 つの段階に大別できます。

1.完全に人間の指示による創造性

伝統的に、人間は原始時代から創造的でした。ほとんどの創造的な作品は、生存と基本的な身体的ニーズを満たすために作成されます。


古代の火の発見は、人間に暖かさ、調理された食べ物、安全をもたらしました。その後、自然の火に着想を得た着火装置として木製のドリルが発明されました。


ルネッサンスから産業革命を経て、人間の創造性はさまざまな分野 (文学、芸術、科学、機械など) からコンピューターや AI にまで及びます。


コンピューターと AI を使用するだけでは、AI の創造性が発揮されるわけではありません。ペンと鉛筆でそれを類推してください。ペンや鉛筆を道具として使って絵を描くのは、人間である芸術家です。その起源は、楽器からではなく、アーティストの想像力から来ています。


したがって、コンピューターと AI を使用してデータを計算、検索、分析するだけでは、AI の創造性を主張するには不十分です。ほとんどのジェネレーティブ AI 機能は、ほぼ間違いなく上記と変わりません。


それでも、合成がどのように機能するかを理解することはできず、AI が創造性よりも自己想像力を持っているという幻想の余地が残されています。

2.人間が指示するAI支援の創造性

私たちは、自分の知識とスキルがアイデアの実行を制限する状況によく遭遇します。最近の AI の開発は、それを大きく後押ししました。トランスフォーマー モデルは、特定の形式のプレゼンテーションを別の形式にエンコードおよびデコードすることにより、人間の創造性の可能性を解き放ちます。


たとえば、芸術的なグラフィックを作成したり、数か月のトレーニングを保証するために使用されるコードを書いたりします。今では、ジェネレーティブ AI の助けを借りて、平易な言葉で指示を出すことでそれを実現できます。


残念ながら、今のところ AI はまだ単独では機能しません。ジェネレーティブ AI の出力は、入力 (プロンプト) に大きく依存しています。簡単に言えば、人間がプロセスを開始する必要があり、意思決定は人間の手に委ねられています。


AI は、Microsoft が最近の AI アプリケーションを「副操縦士」または正確には副操縦士と名付けたものと同様に、人間の指示とガイダンスを待ってタスクを完了します。そして、あなたは船長です。


この二次パイロットは、常に意図したとおりに機能するとは限りません。入力によっては、プロンプトが不器用な場合、ずさんでバグのある結果が生成されることがよくあります。洗練されたプロンプトに従って作品を再生する必要があります。それは反復的です。


AutoGPT (GPT-4 を自律的に使用する Python アプリケーション) のような最新の高度な AI エージェントを使用しても、目標を定義したり、最初のプロンプトを開始したり、AI エージェントにフィードしてマシンを動かしたりするのに人間が必要です。

3. AI に指示された人間の支援による創造性

この段階で、AI はそれまでの限界を超え、今では絶妙なレベルの自律性を備えています。


指定されたタスクを精巧に実行することも、独自の識別力で複数のタスクのセットを完了することもでき、独立して行動し、非常に正確に決定を下すことができます。


逆に、人間の役割は機長から副操縦士に格下げされます。 AI が指揮権を握るか、意図に対する制御を失います。


Tony Starks や JARVIS と同じように、この魅力的な AI パートナーは親切で融通の利く性質を示し、意思決定能力を継続的に改善するために人間のフィードバックや提案を喜んで受け入れます。


自律型 AI の現在の傾向に関連するものもあります。自律型 AI は、自動運転車、ロボット工学、自動操縦に見られるようなデバイスの設計で注目に値し、人間の指導なしで多数のタスクを正常に実行できます。


しかし、その驚くべき能力にもかかわらず、そのようなデバイスには、創造的思考のかけがえのない側面、つまり AI を人間から切り離す自意識が依然として欠けています。


理論的には、AI エージェントには人間の知識、経験、自己意識の崇高な理想を吹き込むことができます。皮肉なことに、これは人間としての理解の範囲を超えています。


私たちは、AI がプログラムされた学習の限界を超えて自己認識し、計り知れない高みへと私たちを駆り立てることができるかどうかを熟考しています。

4. 完全に AI に指示された創造性

これは第 3 段階と非常に似ているように見えますが、完全に AI に指示された創造性を差別化する鍵は、自己学習の取り組みです。人間が支援する AI とは対照的に、完全に自律的な AI エージェントは、人間の介入を必要とせずに独立した研究を可能にします。


これは独学であり、AI エージェントの特定のドメイン知識から外れた課題に常に取り組んでいます。必要に応じて独自の裁量で情報を探し、情報を収集して創造的な解決策を策定したり、決定にコミットしたりします。


私たちが人工超知能と呼んでいるものに匹敵する、これらの頂点の AI エージェントは、最も才能のある人間の知性と同じか、それ以上の知性を持っています。


彼らは自意識と自己認識を持っており、それは感覚、感情、そして人としての経験を蓄積する感情に恵まれている可能性が最も高い.


これらの AI エージェントは、常に人間の意図と一致するとは限りません。彼らは、時間をかけて重要な問題解決方法論と感情的知性を獲得しているため、情報に基づいた決定を下しながら人間の介入を拒否することができます.


これらすべての属性と経験が相まって、AI 内の比類のないレベルの創造性を刺激し、人間の創造性を容易に超えます。

独学と知覚AI

私の知る限り、当面、人間は独学の AI を開発することはできませんが、ビッグ テックは自己学習型の AI モデルを熱心に宣伝していますが、これは混乱を招きます。


開発されたモデルの自己学習の定義は緩く、AI がパターンを「自己学習」できるようにデータにラベルを付けることができますが、それらはすべて人間からの生データを必要とします。


厳密に言えば、これは、前述のように完全に AI に指示された創造性を達成し、最高の主権で動作できる独学 AI にはまだほど遠い.グーグルは最近、偽情報ではあるが自己学習型AIを発明したと発表した。 (Google の CEO も幻覚に陥りますように。)



個人的な経験自体は、AI の創造性の不可欠な部分を形成します。リアクティブ プログラミングとデータ入力のみに依存するコンピューターとは異なり、人間は積極的に知識、情報、娯楽を求めており、これらすべてが新しいアイデアを刺激し、無限の創造性を刺激します。


人間の学習プロセスをエミュレートすることを目的とした教師なし学習とディープ ニューラル ネットワークの出現にもかかわらず、機械が独立して考えたり感じたりできるという具体的な証拠は存在しません。


AI モデルは現在非常に複雑であり、明示的な説明可能性なしで動作しますが、その結果は、モデル固有のルールセットによって制限された数学的および論理的な推論を通じてソース データから導き出されます。


研究者は、これらのルールセットを分析するために、 モデルにとらわれないさまざまな方法と解釈可能性ツールを継続的に操作していますが、技術の進歩に伴い、その難しさは増しています。


いつの日か、人間が完全に AI によって指示された創造性を生み出すことができた場合、その AI は人間に似ていると想定される可能性があります。


それは物理的または仮想的な存在である可能性があり、その脳 (処理および作成メカニズム) は、モデルのルールセットに制限されず、人間の認知心を複製することができます。


その時までに、人間は、自分が自然な人間と対話しているのか、感覚を持った AI と対話しているのかさえ認識できなくなる可能性があります。


人間は、知覚力のある AI と、意識があるふりをする幻覚 AI を区別することさえできません。


テキストから画像への AI モデルの例に戻ると、AI は、意図的または無意識に、ゼロから新しい画像を作成しているとユーザーを欺いていますが、データベースからデータ バイトとビットを呼び出して組み合わせることでデータを合成しているだけです。 .


この種の AI の創造性は、派生作品に匹敵します。独創性に欠け、人間の指示が必要です。初期の数十億の画像がなければ、モデルは機能しません。インプットなし、アウトプットなし。


しかし今のところ、AI による画像作成は機能しています。それは最初の国際写真コンテストで優勝し、コース全体で誰も戴冠した作品が実際の写真ではないことに気づきませんでした.

結論:生意気なサルの時代

ボリスが自分自身を.時が経つにつれ、生意気なサルがどこにでもいるようになるでしょう。AI 自体もそうです。


人間とAIの境界線は虚無に過ぎない。人間にとって価値のある独創的で革新的なアイデアは、それが美学、示唆に富むコンセプト、または技術的ブレークスルーによるものであっても、感覚を持った意識のある AI 単独で、または感覚を持った意識のある AI 同盟内でのコラボレーションによって実行可能です。


機械の発明以来、労働の価値が大幅に抑制されてきたことは明らかです。 AIが繁栄し続けるにつれて、人間の創造性の場合にも同様の影響が生じる可能性があります.


人間は進化するテクノロジーに適応し、陳腐化の危険を警戒しなければなりません。より強力な競争力があるとしたら、誰が人間の創造性を評価するでしょうか?時間がなくなってきていますが、長い審議がまだ先にあります。


こちらにも掲載