GPT4o API 리뷰 1 | 멀티모달에 대한 보편적 접근성

새로워지기/마흔의 생활코딩

GPT4o API 리뷰 1 | 멀티모달에 대한 보편적 접근성

청춘만화 2024. 5. 17. 18:32

주의! 지극히 편향되고 주관적일 뿐만아니라 - LLM이라는 기술적이나 Feature적 측면이 아닌 과거 인간의 인지 범위의 변화에 따른 - 개인적 사유의 기록이다. 개인적으로 생활코딩 실습을 하면서 해당 기술에 대한 리뷰를 남긴적은 없었던 것 같다. 하지만 이번 Gpt 4o API 실습을 진행하면서 -특히 선으로 그림 도형에 대한 면적응 구하는 문제- 적지않은 충격을 받았다. 그래서 이번에는 그 과정에서 느꼈던 - 나중에 보면 창피할지도 모를 - 개인적 소회를 남겨본다.

OpenAI GPT 4o API 실습에 대한 리뷰
👉 1. 첫 느낌, 멀티모달에 대한 보편적 접근성
2. 느낌의 배경, 나는 생각한다 고로 존재한다( feat. 할루시네이션)

인간의 철학에 있어서 전통 철학(형이상학), 특히 데카르트와 흄은 이미지를 실재에 관한 참된 지식을 가로막는 ’가상(의 이미지)’로 간주했었다. 이후 얼마의 시간이 지난 후, 들뢰즈라는 인물이 나와 이미지를 그 무엇에 대한 단순한 모방이 아니라 ‘실재를 구성하는 블록’이라고 설명했고 비슷한? 시기, 샤르트르는 이미지를 불완전한 거짓이 아니라 우리가 세계를 바라보는 근본 방식이라 정의한바 있다.
짧은 소견으로 아마 순수 ‘물질적인 실체’에 대한 이해에서 실존하는 당사자(존재)로서의 ‘외부 세계(또는 타자)에 대한 인식’으로의 전환하던 시점이 아닌가 생각된다.

사실 이미지에 대한 철학적 논쟁을 하기 전에, 이미 활자가 처음 나왔을 때도 당시 지식인?들은 특정 지식이 무한히 복사되어 불특정 다수에게 유통되는 현상에 대해 격하게 우려를 표한 바 있다.
이와 같이 활자를 비롯해 이미지, 그리고 최근에는 동영상 콘텐츠(때론 지식, 더 나아가 간접 경험)대한 경계를 하는 현상은 마치 미셸 푸코의 말처럼, (인간이 정의한 상식은) 순수 사유의 특권은 시대에 따라 계속 바뀌고 있는 것은 아닌가 하는 생각이 든다

아래 사진은 인간이 이미지-신체적 시각 인지 구조를 비롯해 이를 활용한 다양한 오브제-에 대해 이제 막? 인식하고 그 지식이 조금씩 유통되는 시대에 사유했던 철학자들의 고민을 다루고 있다. 심지어 지금은 활자와 이미지(스크린 또는 영상)을 넘어, 소위 동-영상의 시대이다. 조금이나마 간접적으로나마 타자화해서 볼 수 있는 인간의 인식이 아닌가 하는 생각이 든다.

확증편향일 수 있고 지독하게 일반화된 그것일 수 있지만, 피쳐폰을 사용하고 PDA폰을 사용하다 스마트폰을 경험하게된 입장에서(Gpt4o로 덕분에?) 본격적으로 시작될 개인의 멀티모달에 대한 보편적 접근성은 매우 중요한 방점이라는 생각이 들었다.
이는 인류에게 매우 큰 영향을 미친 구전에서 활자로 활자에서 이미지 그리고 동영상으로 인해 전환된 인간의 인식/인지(범위)의 팽창 또는 ~~다양성~~ 양극단화와 같이 현재 AI라고 불리는 기술 자체와 이를 능동적( 때론 수동적)으로 접하게 될 인간은 또 어떠한, 새로운 국면을 맞게 될지,,, 중요한 시기라 생각된다.

그동안 인간은 도구(특히 스마트폰 물론 각기 다른 제도, 문화, 지식을 포함해서)를 만들고 그 도구는 다시 인간을 ~~만들?~~길들여왔다. 과연 이번에는 인간이 만든, ~~도구라고 생각되는~~ ? AI는 과연 인간을 어떻게 변화를 일으킬 것인가..

~~과거 피쳐폰, MP3 Player를 돌이켜보면 드는 감정과 기억들 처럼 지금의 변화도 하나의 추억으로 회상할 수 있길, ..~~물론 당시 해당 필드에서는 피튀기고 눈물 범벅이었겠지만.. 물론 지금은 비단 IT산업 뿐만아니라 사회학, 철학 분야에서도 어느 때보다 분주했던 시절로 회상되겠지만..

그냥 그렇다고

딱, 일 인분의 주관으로서 그 인간이 느끼는 감정과 이 시절의 소회를 남겨본다.