ในครั้งแรกทางวิทยาศาสตร์ นักประสาทวิทยาได้สร้างระบบที่แปลความคิดเป็นคำพูดที่เข้าใจได้และเป็นที่จดจำโดยการตรวจสอบการทำงานของสมองของใครบางคน เทคโนโลยีนี้สามารถสร้างคำที่บุคคลได้ยินขึ้นใหม่ด้วยความชัดเจนอย่างที่ไม่เคยมีมาก่อน ความก้าวหน้านี้ซึ่งควบคุมพลังของเครื่องสังเคราะห์เสียงพูดและปัญญาประดิษฐ์ อาจนำไปสู่วิธีการใหม่ๆ สำหรับคอมพิวเตอร์ในการสื่อสารโดยตรงกับสมอง
นอกจากนี้ยังวางรากฐานในการช่วยเหลือผู้
ที่ไม่สามารถพูดได้ เช่น ผู้ที่เป็นโรคเส้นโลหิตตีบด้านข้าง amyotrophic (ALS) หรือฟื้นตัวจากโรคหลอดเลือดสมอง ฟื้นความสามารถในการสื่อสารกับโลกภายนอกการค้นพบนี้เผยแพร่ในวันนี้ใน รายงาน ทางวิทยาศาสตร์”เสียงของเราช่วยเชื่อมโยงเรากับเพื่อน ครอบครัว และโลกรอบตัวเรา ซึ่งเป็นสาเหตุที่ทำให้สูญเสียพลังเสียงอันเนื่องมาจากการบาดเจ็บหรือโรคภัยไข้เจ็บ” Nima Mesgarani ผู้เขียนอาวุโส
ของหนังสือพิมพ์และผู้ตรวจสอบหลักของ
Columbia กล่าว มหาวิทยาลัย. “ด้วยการศึกษาในวันนี้ เรามีวิธีที่มีศักยภาพในการฟื้นฟูพลังนั้น เราได้แสดงให้เห็นว่าด้วยเทคโนโลยีที่เหมาะสม ความคิดของคนเหล่านี้สามารถถอดรหัสและเข้าใจได้โดยผู้ฟังทุกคนที่เกี่ยวข้อง : แว่นตาคำบรรยายอัจฉริยะช่วยให้ผู้ชมที่หูหนวกสามารถชมนักแสดงละครสดได้โดยตรง
“นี่จะเป็นตัวเปลี่ยนเกม
มันจะทำให้ทุกคนที่สูญเสียความสามารถในการพูดไม่ว่าจะด้วยอาการบาดเจ็บหรือเจ็บป่วย มีโอกาสใหม่ในการเชื่อมต่อกับโลกรอบตัวพวกเขา”การวิจัยหลายทศวรรษแสดงให้เห็นว่าเมื่อผู้คนพูด — หรือแม้แต่จินตนาการถึงการพูด — รูปแบบของกิจกรรมปากโป้งจะปรากฏในสมองของพวกเขา รูปแบบสัญญาณที่แตกต่าง (แต่สามารถจดจำได้) ก็ปรากฏขึ้นเช่นกันเมื่อเราฟังใครซักคนพูดหรือจินตนาการว่ากำลังฟังอยู่
ผู้เชี่ยวชาญที่พยายามบันทึก
และถอดรหัสรูปแบบเหล่านี้ มองเห็นอนาคตที่ความคิดไม่จำเป็นต้องซ่อนอยู่ในสมอง แต่สามารถแปลเป็นคำพูดด้วยวาจาได้ตามต้องการแต่การบรรลุผลสำเร็จนี้ได้พิสูจน์ให้เห็นถึงความท้าทาย ความพยายามในการถอดรหัสสัญญาณสมองในช่วงแรกโดย Dr. Mesgarani และคนอื่นๆ มุ่งเน้นไปที่โมเดลคอมพิวเตอร์อย่างง่ายที่วิเคราะห์สเปกตรัม ซึ่งเป็นการแสดงความถี่เสียงด้วยสายตา
‘ไม่ใช่ชุด Ant-Man’ แต่นักวิจัยค้นพบวิธีย่อ
ขนาดวัตถุให้เหลือ 1000 ของขนาดดั้งเดิมแต่เนื่องจากวิธีการนี้ล้มเหลวในการสร้างสิ่งที่คล้ายกับคำพูดที่เข้าใจได้ ดร.เมสการานีและทีมของเขา รวมทั้งฮัสซัน อักบารี ผู้เขียนคนแรกของหนังสือพิมพ์จึงหันไปใช้ผู้พูดแทน ซึ่งเป็นอัลกอริทึมของคอมพิวเตอร์ที่สามารถสังเคราะห์คำพูดหลังจากได้รับการฝึกฝนเกี่ยวกับการบันทึกคนพูด
“นี่เป็นเทคโนโลยีเดียวกับที่ Amazon Echo
และ Apple Siri ใช้ในการตอบคำถามของเราด้วยวาจา” ดร. เมสการานีซึ่งเป็นรองศาสตราจารย์ด้านวิศวกรรมไฟฟ้าของ Columbia Engineering กล่าวเพื่อสอนให้นักพูดตีความการทำงานของสมอง Dr. Mesgarani ได้ร่วมมือกับ Ashesh Dinesh Mehta ศัลยแพทย์ระบบประสาทที่ Northwell Health Physician Partners Neuroscience Institute และผู้เขียนร่วมของบทความในวันนี้ นพ. เมธาปฏิบัติต่อผู้ป่วยโรคลมบ้าหมู ซึ่งบางคนต้องได้รับการผ่าตัดเป็นประจำ
Credit : สล็อตแตกง่าย