ข้อมูล

บอกเหตุผลสองประการว่าทำไมจึงเป็นไปไม่ได้ที่จะกำหนดลำดับนิวคลีโอไทด์ของยีนจากลำดับกรดอะมิโนของโพลีเปปไทด์

บอกเหตุผลสองประการว่าทำไมจึงเป็นไปไม่ได้ที่จะกำหนดลำดับนิวคลีโอไทด์ของยีนจากลำดับกรดอะมิโนของโพลีเปปไทด์



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ฉันคิดได้เพียงเหตุผลเดียวเท่านั้น ซึ่งเป็นเพราะว่าโคดอนที่ต่างกันสามารถระบุกรดอะมิโนตัวเดียวกันได้ อย่างไรก็ตาม ฉันมีปัญหาในการคิดเหตุผลอื่น


ฉันสามารถนึกถึงเหตุผลอย่างน้อย 3 ประการนอกเหนือจากที่คุณให้มา:

1: ตามที่กล่าวไว้ในความคิดเห็น การประกบ RNA เกิดขึ้นกับโปรตีนเข้ารหัส RNA ของผู้ส่งสารส่วนใหญ่ในยูคาริโอต ส่วนของ mRNA อาจถูกแยกออก ดังนั้น mRNA หลายตัวที่มีลำดับโคดอนต่างกันสามารถเข้ารหัสยีนเดียวกันได้

2: การแปลเป็นกระบวนการเก็บสถานะ เนื่องจากขึ้นอยู่กับเฟรมของ codon ดังนั้น ยีนที่มีลำดับ GGATGATGATGTAA จะเข้ารหัสโปรตีนเดียวกันกับยีนที่มีลำดับ ATGATGATGTAA เนื่องจากโคดอนเริ่มต้นขยับกรอบการแปลลงด้านล่าง

3: ยีนประกอบด้วยภูมิภาคที่ไม่ได้แปลในภูมิภาคก่อนเริ่มและหลังโคดอนหยุด นิวคลีโอไทด์เหล่านี้ไม่สามารถทำนายได้จากลำดับโปรตีน แต่โดยทั่วไปมีความสำคัญในการควบคุมการแสดงออกของโปรตีน


อินตรอนไม่รวมอยู่ในลำดับพอลิเปปไทด์


การกลายพันธุ์เงียบ

การกลายพันธุ์เงียบ เป็นการกลายพันธุ์ใน DNA ที่ไม่มีผลต่อฟีโนไทป์ของสิ่งมีชีวิตที่สังเกตได้ พวกมันเป็นการกลายพันธุ์ที่เป็นกลางบางประเภท วลี การกลายพันธุ์เงียบ มักใช้สลับกับวลี การกลายพันธุ์ที่มีความหมายเหมือนกัน อย่างไรก็ตาม การกลายพันธุ์ที่มีความหมายเหมือนกันนั้นไม่ได้เงียบเสมอไปหรือในทางกลับกัน [1] [2] [3] [4] [5] การกลายพันธุ์แบบพ้องเสียงสามารถส่งผลกระทบต่อการถอดความ การประกบ การขนส่ง mRNA และการแปล ซึ่งสิ่งเหล่านี้สามารถเปลี่ยนแปลงฟีโนไทป์ได้ [3] ความจำเพาะของซับสเตรตของ tRNA ต่อโคดอนที่หายากอาจส่งผลต่อระยะเวลาของการแปล และในทางกลับกัน การพับร่วมของโปรตีน [1] สิ่งนี้สะท้อนให้เห็นในอคติการใช้ codon ที่พบในหลายสายพันธุ์ การกลายพันธุ์ที่ทำให้ codon ที่เปลี่ยนแปลงไปผลิตกรดอะมิโนที่มีฟังก์ชันคล้ายกัน (เช่น. การกลายพันธุ์ที่สร้าง leucine แทน isoleucine) มักถูกจัดอยู่ในประเภทที่เงียบถ้ารักษาคุณสมบัติของกรดอะมิโนไว้ การกลายพันธุ์นี้มักไม่ส่งผลต่อการทำงานของโปรตีนอย่างมีนัยสำคัญ [6]


สารบัญ

การกลายพันธุ์ของจุดมักเกิดขึ้นระหว่างการจำลองแบบดีเอ็นเอ การจำลองแบบดีเอ็นเอเกิดขึ้นเมื่อโมเลกุลดีเอ็นเอที่มีสายคู่หนึ่งสร้างดีเอ็นเอสายเดี่ยวสองสาย ซึ่งแต่ละสายเป็นแม่แบบสำหรับการสร้างสายคู่สม การกลายพันธุ์ของจุดเดียวสามารถเปลี่ยนลำดับดีเอ็นเอทั้งหมดได้ การเปลี่ยนพิวรีนหรือไพริมิดีนหนึ่งตัวอาจเปลี่ยนกรดอะมิโนที่รหัสนิวคลีโอไทด์ใช้

การกลายพันธุ์ของจุดอาจเกิดขึ้นจากการกลายพันธุ์ที่เกิดขึ้นเองระหว่างการจำลองดีเอ็นเอ อัตราการกลายพันธุ์อาจเพิ่มขึ้นโดยสารก่อกลายพันธุ์ สารก่อกลายพันธุ์สามารถเกิดขึ้นได้ทางกายภาพ เช่น การแผ่รังสีจากรังสียูวี รังสีเอกซ์ หรือความร้อนจัด หรือสารเคมี (โมเลกุลที่วางคู่เบสผิดตำแหน่งหรือทำลายรูปทรงเกลียวของดีเอ็นเอ) มักมีการศึกษาสารก่อกลายพันธุ์ที่เกี่ยวข้องกับมะเร็งเพื่อเรียนรู้เกี่ยวกับมะเร็งและการป้องกัน

มีหลายวิธีในการทำให้เกิดการกลายพันธุ์ของจุด ประการแรก แสงอัลตราไวโอเลต (UV) และแสงความถี่สูงสามารถทำให้เกิดอิออนอิเลคตรอน ซึ่งอาจส่งผลต่อ DNA ได้ โมเลกุลของออกซิเจนที่ทำปฏิกิริยากับอนุมูลอิสระซึ่งเป็นผลพลอยได้จากการเผาผลาญของเซลล์ อาจเป็นอันตรายต่อ DNA ได้มากเช่นกัน สารตั้งต้นเหล่านี้สามารถนำไปสู่การแตกของ DNA แบบสายเดี่ยวและตัวแบ่ง DNA แบบสองสาย ประการที่สาม พันธะใน DNA จะลดลงในที่สุด ซึ่งสร้างปัญหาอื่นเพื่อรักษาความสมบูรณ์ของ DNA ให้มีมาตรฐานสูง นอกจากนี้ยังสามารถมีข้อผิดพลาดในการจำลองแบบที่นำไปสู่การแทนที่ การแทรก หรือการลบการกลายพันธุ์

การจัดหมวดหมู่การเปลี่ยนผ่าน/การดัดแปลงแก้ไข

ในปี 1959 Ernst Freese ได้บัญญัติศัพท์คำว่า "transitions" หรือ "transversions" เพื่อจัดหมวดหมู่ของการกลายพันธุ์ของจุดประเภทต่างๆ [2] [3] การเปลี่ยนผ่านคือการแทนที่ฐาน purine ด้วย purine อื่นหรือการเปลี่ยน pyrimidine ด้วย pyrimidine อื่น การเปลี่ยนผ่านเป็นการแทนที่พิวรีนด้วยไพริมิดีนหรือในทางกลับกัน อัตราการกลายพันธุ์ของทรานซิชัน (อัลฟ่า) และทรานส์เวอร์ชัน (เบต้า) มีความแตกต่างกันอย่างเป็นระบบ การกลายพันธุ์ของการเปลี่ยนผ่านนั้นพบได้บ่อยกว่าการเปลี่ยนผ่านประมาณสิบเท่า

การจัดหมวดหมู่การทำงาน แก้ไข

การกลายพันธุ์ที่ไร้สาระรวมถึงการหยุดกำไรและการสูญเสียเริ่มต้น Stop-gain เป็นการกลายพันธุ์ที่ส่งผลให้ codon สิ้นสุดก่อนกำหนด (ได้รับการหยุด) ซึ่งเป็นสัญญาณสิ้นสุดการแปล การหยุดชะงักนี้ทำให้โปรตีนสั้นลงอย่างผิดปกติ จำนวนกรดอะมิโนที่สูญเสียไปจะเป็นสื่อกลางในการส่งผลกระทบต่อการทำงานของโปรตีนและไม่ว่าจะทำงานอย่างไร [4] Stop-loss เป็นการกลายพันธุ์ใน codon การสิ้นสุดดั้งเดิม (หยุดหายไป) ส่งผลให้มีการต่อปลายคาร์บอกซิลของโปรตีนอย่างผิดปกติ Start-gain สร้าง AUG start codon ต้นน้ำของไซต์เริ่มต้นดั้งเดิม หาก AUG ใหม่อยู่ใกล้กับไซต์เริ่มต้นเดิม ในเฟรมภายในการถอดเสียงที่ประมวลผลแล้วและดาวน์สตรีมไปยังไซต์ที่มีผลผูกพันไรโบโซม สามารถใช้เพื่อเริ่มการแปลได้ ผลที่น่าจะเป็นไปได้คือกรดอะมิโนเพิ่มเติมที่เติมไปยังปลายอะมิโนของโปรตีนดั้งเดิม การกลายพันธุ์ของเฟรมชิฟต์ยังเป็นไปได้ในการกลายพันธุ์ที่เริ่มได้รับ แต่โดยทั่วไปแล้วจะไม่ส่งผลต่อการแปลของโปรตีนดั้งเดิม การสูญเสียการเริ่มต้นคือการกลายพันธุ์ของจุดใน codon เริ่มต้น AUG ของการถอดเสียง ซึ่งส่งผลให้การผลิตโปรตีนลดลงหรือลดลง

รหัสการกลายพันธุ์ Missense สำหรับกรดอะมิโนชนิดต่างๆ การกลายพันธุ์ missense เปลี่ยน codon เพื่อสร้างโปรตีนที่แตกต่างกัน การเปลี่ยนแปลงที่ไม่มีความหมายเหมือนกัน [4] การกลายพันธุ์แบบอนุรักษ์นิยมส่งผลให้เกิดการเปลี่ยนแปลงของกรดอะมิโน อย่างไรก็ตาม คุณสมบัติของกรดอะมิโนยังคงเหมือนเดิม (เช่น ไม่ชอบน้ำ ชอบน้ำ เป็นต้น) ในบางครั้ง การเปลี่ยนแปลงของกรดอะมิโนหนึ่งตัวในโปรตีนไม่ได้ส่งผลเสียต่อสิ่งมีชีวิตโดยรวม โปรตีนส่วนใหญ่สามารถทนต่อการกลายพันธุ์ได้หนึ่งหรือสองจุดก่อนที่การทำงานของพวกมันจะเปลี่ยนไป การกลายพันธุ์ที่ไม่อนุรักษ์นิยมส่งผลให้เกิดการเปลี่ยนแปลงของกรดอะมิโนที่มีคุณสมบัติแตกต่างจากชนิดพันธุ์ป่า โปรตีนอาจสูญเสียการทำงานซึ่งอาจส่งผลให้เกิดโรคในร่างกายได้ ตัวอย่างเช่น โรคเซลล์เคียวเกิดจากการกลายพันธุ์จุดเดียว (การกลายพันธุ์ missense) ในยีนเบตา-เฮโมโกลบินที่แปลงโคดอน GAG เป็น GUG ซึ่งเข้ารหัสวาลีนของกรดอะมิโนแทนที่จะเป็นกรดกลูตามิก โปรตีนยังอาจแสดง "การเพิ่มขึ้นของการทำงาน" หรือถูกกระตุ้น เช่นกรณีที่มีการกลายพันธุ์ที่เปลี่ยนวาลีนเป็นกรดกลูตามิกในยีน BRAF ซึ่งนำไปสู่การกระตุ้นของโปรตีน RAF ซึ่งทำให้เกิดการส่งสัญญาณแบบไม่จำกัดในเซลล์มะเร็ง [5] นี่เป็นตัวอย่างทั้งสองของการกลายพันธุ์แบบ non-conservative (missense)

รหัสการกลายพันธุ์แบบเงียบสำหรับกรดอะมิโนชนิดเดียวกัน ("การแทนที่แบบพ้องความหมาย") การกลายพันธุ์แบบเงียบไม่ส่งผลต่อการทำงานของโปรตีน นิวคลีโอไทด์เดี่ยวสามารถเปลี่ยนแปลงได้ แต่โคดอนใหม่ระบุกรดอะมิโนตัวเดียวกัน ส่งผลให้เกิดโปรตีนที่ไม่กลายพันธุ์ การเปลี่ยนแปลงประเภทนี้เรียกว่าการเปลี่ยนแปลงที่เหมือนกันตั้งแต่รหัส codon เก่าและใหม่สำหรับกรดอะมิโนตัวเดียวกัน เป็นไปได้เนื่องจาก 64 codons ระบุกรดอะมิโนเพียง 20 ชนิดเท่านั้น อย่างไรก็ตาม โคดอนที่ต่างกันสามารถนำไปสู่ระดับการแสดงออกของโปรตีนที่แตกต่างกันได้ [4]

การแทรกและการลบคู่เบสเดียว

บางครั้งคำว่า การกลายพันธุ์ของจุด ใช้เพื่ออธิบายการแทรกหรือการลบคู่เบสเดี่ยว (ซึ่งมีผลเสียมากกว่าต่อโปรตีนที่สังเคราะห์ขึ้นเนื่องจากนิวคลีโอไทด์ยังคงถูกอ่านเป็นแฝดสาม แต่ในเฟรมที่ต่างกัน: การกลายพันธุ์ที่เรียกว่าการกลายพันธุ์ของเฟรม) [4]

การกลายพันธุ์ของจุดที่เกิดขึ้นในลำดับที่ไม่มีการเข้ารหัสนั้นมักจะไม่มีผลที่ตามมา แม้ว่าจะมีข้อยกเว้นก็ตาม หากคู่เบสที่กลายพันธุ์อยู่ในลำดับโปรโมเตอร์ของยีน การแสดงออกของยีนอาจเปลี่ยนไป นอกจากนี้ หากการกลายพันธุ์เกิดขึ้นในตำแหน่งประกบของอินตรอน การดำเนินการนี้อาจรบกวนการต่อประกบที่ถูกต้องของ pre-mRNA ที่คัดลอกมา

โดยการเปลี่ยนกรดอะมิโนเพียงตัวเดียว เปปไทด์ทั้งหมดอาจเปลี่ยนแปลง ดังนั้นจึงเปลี่ยนโปรตีนทั้งหมด โปรตีนชนิดใหม่นี้เรียกว่าตัวแปรโปรตีน หากโปรตีนดั้งเดิมทำหน้าที่ในการสืบพันธุ์ของเซลล์ การกลายพันธุ์แบบจุดเดียวนี้สามารถเปลี่ยนกระบวนการทั้งหมดของการสร้างเซลล์สำหรับสิ่งมีชีวิตนี้

การกลายพันธุ์ของจุดเจิร์มไลน์สามารถนำไปสู่ลักษณะหรือโรคที่เป็นประโยชน์และเป็นอันตราย สิ่งนี้นำไปสู่การดัดแปลงตามสภาพแวดล้อมที่สิ่งมีชีวิตอาศัยอยู่ การกลายพันธุ์ที่ได้เปรียบสามารถสร้างข้อได้เปรียบให้กับสิ่งมีชีวิตนั้นและนำไปสู่การถ่ายทอดลักษณะจากรุ่นสู่รุ่น การปรับปรุงและเป็นประโยชน์ต่อประชากรทั้งหมด ทฤษฎีวิวัฒนาการทางวิทยาศาสตร์ขึ้นอยู่กับการกลายพันธุ์ของจุดในเซลล์เป็นอย่างมาก ทฤษฎีนี้อธิบายความหลากหลายและประวัติของสิ่งมีชีวิตบนโลก ในความสัมพันธ์กับการกลายพันธุ์แบบจุด ระบุว่าการกลายพันธุ์ที่เป็นประโยชน์ช่วยให้สิ่งมีชีวิตเจริญเติบโตและสืบพันธุ์ได้ ด้วยเหตุนี้จึงส่งต่อยีนกลายพันธุ์ที่ได้รับผลกระทบในเชิงบวกไปยังคนรุ่นต่อไป ในทางกลับกัน การกลายพันธุ์ที่เป็นอันตรายทำให้สิ่งมีชีวิตตายหรือมีโอกาสเกิดซ้ำน้อยกว่าในปรากฏการณ์ที่เรียกว่าการคัดเลือกโดยธรรมชาติ

มีผลกระทบระยะสั้นและระยะยาวที่แตกต่างกันที่อาจเกิดขึ้นจากการกลายพันธุ์ คนที่เล็กกว่าจะทำให้วัฏจักรเซลล์หยุดชะงักในหลายจุด ซึ่งหมายความว่า codon ที่เข้ารหัสสำหรับกรดอะมิโนไกลซีนอาจเปลี่ยนเป็น codon หยุด ทำให้โปรตีนที่ควรได้รับการผลิตมีรูปร่างผิดปกติและไม่สามารถทำงานได้ตามที่ตั้งใจไว้ เนื่องจากการกลายพันธุ์สามารถส่งผลกระทบต่อ DNA และด้วยเหตุนี้โครมาติน จึงสามารถยับยั้งไม่ให้ไมโทซิสเกิดขึ้นได้เนื่องจากขาดโครโมโซมที่สมบูรณ์ ปัญหาอาจเกิดขึ้นในระหว่างกระบวนการถอดความและการจำลองแบบของดีเอ็นเอ สิ่งเหล่านี้ห้ามไม่ให้เซลล์สืบพันธุ์และทำให้เซลล์ตาย ผลกระทบระยะยาวอาจเป็นการเปลี่ยนแปลงถาวรของโครโมโซม ซึ่งอาจนำไปสู่การกลายพันธุ์ การกลายพันธุ์เหล่านี้สามารถเป็นประโยชน์หรือเป็นอันตรายได้ มะเร็งเป็นตัวอย่างของการที่พวกเขาสามารถเป็นอันตรายได้ [6]

ผลกระทบอื่น ๆ ของการกลายพันธุ์แบบจุดหรือนิวคลีโอไทด์พหุสัณฐานเดี่ยวใน DNA ขึ้นอยู่กับตำแหน่งของการกลายพันธุ์ภายในยีน ตัวอย่างเช่น หากการกลายพันธุ์เกิดขึ้นในบริเวณยีนที่รับผิดชอบในการเข้ารหัส ลำดับกรดอะมิโนของโปรตีนที่เข้ารหัสอาจเปลี่ยนแปลงได้ ทำให้เกิดการเปลี่ยนแปลงในการทำงาน การแปลตำแหน่งโปรตีน ความคงตัวของโปรตีนหรือโปรตีนเชิงซ้อน มีการเสนอวิธีการหลายวิธีในการทำนายผลของการกลายพันธุ์ที่ผิดพลาดต่อโปรตีน อัลกอริธึมแมชชีนเลิร์นนิงจะฝึกแบบจำลองเพื่อแยกแยะความแตกต่างของโรคที่ทราบจากการกลายพันธุ์ที่เป็นกลาง ในขณะที่วิธีอื่นๆ ไม่ได้ฝึกแบบจำลองอย่างชัดเจน แต่วิธีการเกือบทั้งหมดใช้ประโยชน์จากการอนุรักษ์เชิงวิวัฒนาการโดยสมมติว่าการเปลี่ยนแปลงในตำแหน่งที่อนุรักษ์ไว้มีแนวโน้มว่าจะเป็นอันตรายมากกว่า แม้ว่าวิธีการส่วนใหญ่จะให้การจำแนกประเภทไบนารีของผลกระทบของการกลายพันธุ์เป็นความเสียหายและไม่เป็นอันตราย แต่จำเป็นต้องมีคำอธิบายประกอบระดับใหม่เพื่อเสนอคำอธิบายว่าเหตุใดการกลายพันธุ์เหล่านี้จึงสร้างความเสียหายต่อโปรตีน [7]

นอกจากนี้ หากการกลายพันธุ์เกิดขึ้นในบริเวณของยีนที่กลไกการถอดรหัสจับกับโปรตีน การกลายพันธุ์อาจส่งผลต่อการจับตัวของปัจจัยการถอดรหัส เนื่องจากลำดับนิวคลีโอไทด์สั้นที่รับรู้โดยปัจจัยการถอดรหัสจะเปลี่ยนไป การกลายพันธุ์ในภูมิภาคนี้อาจส่งผลต่ออัตราประสิทธิภาพของการถอดรหัสยีน ซึ่งสามารถเปลี่ยนแปลงระดับของ mRNA และด้วยเหตุนี้ ระดับโปรตีนโดยทั่วไป

การกลายพันธุ์แบบจุดสามารถมีผลกระทบหลายประการต่อพฤติกรรมและการสืบพันธุ์ของโปรตีน ขึ้นอยู่กับตำแหน่งที่การกลายพันธุ์เกิดขึ้นในลำดับกรดอะมิโนของโปรตีน หากการกลายพันธุ์เกิดขึ้นในบริเวณยีนซึ่งมีหน้าที่ในการเข้ารหัสโปรตีน กรดอะมิโนอาจเปลี่ยนแปลงได้ การเปลี่ยนแปลงเล็กน้อยในลำดับของกรดอะมิโนนี้อาจทำให้เกิดการเปลี่ยนแปลงในหน้าที่การงาน การกระตุ้นโปรตีนหมายถึงการเกาะกับเอนไซม์ที่กำหนด โดยที่โปรตีนจะอยู่ภายในเซลล์ หรือปริมาณพลังงานอิสระที่สะสมอยู่ภายในโปรตีน .

หากการกลายพันธุ์เกิดขึ้นในบริเวณของยีนที่กลไกการถอดรหัสจับกับโปรตีน การกลายพันธุ์อาจส่งผลต่อวิธีที่ปัจจัยการถอดรหัสจับกับโปรตีน กลไกของการถอดรหัสจับกับโปรตีนผ่านการจดจำลำดับนิวคลีโอไทด์แบบสั้น การกลายพันธุ์ในบริเวณนี้อาจเปลี่ยนแปลงลำดับเหล่านี้ และด้วยเหตุนี้จึงเปลี่ยนวิธีที่ปัจจัยการถอดรหัสจับกับโปรตีน การกลายพันธุ์ในภูมิภาคนี้อาจส่งผลต่อประสิทธิภาพของการถอดรหัสยีน ซึ่งควบคุมทั้งระดับของ mRNA และระดับโปรตีนโดยรวม [8]

แก้ไขมะเร็ง

การกลายพันธุ์ของจุดในโปรตีนต้านเนื้องอกหลายชนิดทำให้เกิดมะเร็ง ตัวอย่างเช่น การกลายพันธุ์ของจุดใน Adenomatous Polyposis Coli ส่งเสริมการสร้างเนื้องอก [9] การทดสอบใหม่ Fast Parallel proteolysis (FASTpp) อาจช่วยให้สามารถคัดกรองข้อบกพร่องด้านความเสถียรที่เฉพาะเจาะจงในผู้ป่วยมะเร็งแต่ละรายได้อย่างรวดเร็ว [10]

การแก้ไข Neurofibromatosis

โรคโลหิตจางเซลล์เคียว

โรคโลหิตจางเซลล์เคียวเกิดจากการกลายพันธุ์ของจุดในสาย β-globin ของเฮโมโกลบิน ทำให้กรดกลูตามิกของกรดอะมิโนที่ชอบน้ำถูกแทนที่ด้วยวาลีนที่ไม่ชอบน้ำที่ตำแหน่งที่หก

ยีน β-globin พบที่แขนสั้นของโครโมโซม 11 การเชื่อมโยงระหว่างหน่วยย่อย α-globin ชนิด wild-type สองหน่วยกับหน่วยย่อย β-globin ที่กลายพันธุ์ 2 หน่วยสร้างเฮโมโกลบิน S (HbS) ภายใต้สภาวะออกซิเจนต่ำ (เช่น อยู่ที่ระดับความสูงสูง) การไม่มีกรดอะมิโนโพลาร์ที่ตำแหน่งที่ 6 ของสาย β-โกลบินจะส่งเสริมการเกิดพอลิเมอไรเซชันที่ไม่ใช่โควาเลนต์ (การรวมกลุ่ม) ของเฮโมโกลบิน ซึ่งทำให้เซลล์เม็ดเลือดแดงบิดเบี้ยวไปเป็น รูปร่างเคียวและลดความยืดหยุ่นของพวกเขา [14]

เฮโมโกลบินเป็นโปรตีนที่พบในเซลล์เม็ดเลือดแดงและมีหน้าที่ในการขนส่งออกซิเจนไปทั่วร่างกาย [15] มีสองหน่วยย่อยที่ประกอบขึ้นเป็นโปรตีนเฮโมโกลบิน: เบตาโกลบินและอัลฟาโกลบิน [16] เบต้าเฮโมโกลบินถูกสร้างขึ้นจากข้อมูลทางพันธุกรรมของยีน HBB หรือยีน "ฮีโมโกลบิน เบต้า" ที่พบในโครโมโซม 11p15.5 [17] การกลายพันธุ์แบบจุดเดียวในสายโพลีเปปไทด์นี้ ซึ่งมีความยาวกรดอะมิโน 147 ตัว ส่งผลให้เกิดโรคที่เรียกว่า Sickle Cell Anemia [18] Sickle-cell anemia เป็นความผิดปกติแบบ autosomal recessive ที่ส่งผลกระทบต่อ 1 ใน 500 ของชาวแอฟริกันอเมริกัน และเป็นหนึ่งในความผิดปกติของเลือดที่พบบ่อยที่สุดในสหรัฐอเมริกา [17] การแทนที่กรดอะมิโนตัวที่ 6 เพียงครั้งเดียวในเบตาโกลบิน กรดกลูตามิก ด้วยวาลีนส่งผลให้เซลล์เม็ดเลือดแดงผิดรูป เซลล์รูปเคียวเหล่านี้ไม่สามารถขนส่งออกซิเจนได้เกือบเท่าเซลล์เม็ดเลือดแดงปกติ และพวกมันจะติดอยู่ในเส้นเลือดฝอยได้ง่ายขึ้น ทำให้เลือดไปเลี้ยงอวัยวะที่สำคัญไม่ได้ การเปลี่ยนแปลงนิวคลีโอไทด์เดี่ยวในเบตาโกลบินหมายความว่าแม้การออกแรงเพียงเล็กน้อยในส่วนของพาหะก็ส่งผลให้เกิดความเจ็บปวดอย่างรุนแรงและแม้กระทั่งหัวใจวาย ด้านล่างนี้คือแผนภูมิที่แสดงกรดอะมิโนสิบสามตัวแรกในสายโซ่โพลีเปปไทด์เซลล์เคียวปกติและผิดปกติ [18]

ลำดับของฮีโมโกลบินปกติ
สิงหาคม GUG CAC CUG ACU CCU จีเอจี ปิดปาก AAG UCU GCC GUU ACU
เริ่ม วาล ของเขา หลิว ผ่าน มือโปร กลู กลู ลิซ เซอร์ อะลา วาล ผ่าน

ลำดับฮีโมโกลบินเซลล์เคียว
สิงหาคม GUG CAC CUG ACU CCU G U G ปิดปาก AAG UCU GCC GUU ACU
เริ่ม วาล ของเขา หลิว ผ่าน มือโปร วาล กลู ลิซ เซอร์ อะลา วาล ผ่าน

โรค Tay–Sachs Edit

สาเหตุของโรค Tay–Sachs คือความบกพร่องทางพันธุกรรมที่ถ่ายทอดจากพ่อแม่สู่ลูก ข้อบกพร่องทางพันธุกรรมนี้อยู่ในยีน HEXA ซึ่งพบในโครโมโซม 15

ยีน HEXA ทำให้เป็นส่วนหนึ่งของเอนไซม์ที่เรียกว่า beta-hexosaminidase A ซึ่งมีบทบาทสำคัญในระบบประสาท เอนไซม์นี้ช่วยสลายสารไขมันที่เรียกว่า GM2 ganglioside ในเซลล์ประสาท การกลายพันธุ์ในยีน HEXA ขัดขวางการทำงานของ beta-hexosaminidase A เพื่อป้องกันการสลายตัวของสารไขมัน เป็นผลให้สารไขมันสะสมถึงระดับร้ายแรงในสมองและไขสันหลัง การก่อตัวของ GM2 ganglioside ทำให้เกิดความเสียหายต่อเซลล์ประสาท ซึ่งเป็นสาเหตุของอาการและอาการของโรคไต-ซัคส์ (19)

แก้ไขตาบอดสี

ผู้ที่ตาบอดสีมีการกลายพันธุ์ในยีนที่ทำให้สูญเสียกรวยสีแดงหรือสีเขียว ดังนั้นจึงยากที่จะแยกแยะระหว่างสีต่างๆ ดวงตาของมนุษย์มีรูปกรวยสามชนิด: สีแดง สีเขียว และสีน้ำเงิน ตอนนี้นักวิจัยได้ค้นพบว่าบางคนที่มีการกลายพันธุ์ของยีนที่ทำให้ตาบอดสีสูญเสียกรวย "สี" ทั้งชุดโดยไม่มีการเปลี่ยนแปลงความชัดเจนของการมองเห็นโดยรวม (20)

ในอณูชีววิทยา การกลายพันธุ์ของจุดที่เกิดซ้ำ หรือ ฉีก เป็นกระบวนการที่ DNA สะสมการกลายพันธุ์ของการเปลี่ยนแปลง G:C เป็น A:T หลักฐานจีโนมบ่งชี้ว่า RIP เกิดขึ้นหรือเกิดขึ้นในเชื้อราหลายชนิด [21] ในขณะที่หลักฐานจากการทดลองบ่งชี้ว่า RIP ออกฤทธิ์ใน Neurospora crassa, [22] Podospora anserina, [23] Magnaporthe grisea, [24] Leptosphaeria maculans, [25] Gibberella zeae (26) และ Nectria haematococca. [27] อิน Neurospora crassa, ลำดับที่กลายพันธุ์โดย RIP มักจะถูกเมทิลเลต เดอโนโว. [22]

RIP เกิดขึ้นระหว่างขั้นตอนทางเพศในนิวเคลียสเดี่ยวหลังการปฏิสนธิ แต่ก่อนที่จะมีการจำลองดีเอ็นเอแบบไมโอติก [22] อิน Neurospora crassaทำซ้ำลำดับที่มีความยาวอย่างน้อย 400 คู่เบสที่มีความเสี่ยงต่อ RIP การเกิดซ้ำโดยมีความเฉพาะตัวของนิวคลีโอไทด์ที่ต่ำถึง 80% อาจต้อง RIP แม้ว่ากลไกที่แน่นอนของการรู้จำซ้ำและการกลายพันธุ์จะเข้าใจได้ไม่ดีนัก แต่ RIP ส่งผลให้เกิดลำดับซ้ำซึ่งผ่านการกลายพันธุ์ของทรานซิชันหลายครั้ง

ดูเหมือนว่าการกลายพันธุ์ของ RIP ไม่ได้จำกัดอยู่เพียงลำดับซ้ำๆ ที่จริงแล้ว ตัวอย่างเช่น ในเชื้อราไฟโตที่ทำให้เกิดโรค L. maculans, พบการกลายพันธุ์ของ RIP ในบริเวณสำเนาเดียว ติดกับองค์ประกอบที่เกิดซ้ำ บริเวณเหล่านี้เป็นบริเวณที่ไม่มีรหัสหรือยีนที่เข้ารหัสโปรตีนที่ถูกคัดหลั่งขนาดเล็กรวมทั้งยีนที่มีความรุนแรง ระดับของ RIP ภายในขอบเขตสำเนาเดียวเหล่านี้เป็นสัดส่วนกับความใกล้ชิดกับองค์ประกอบที่ซ้ำกัน (28)

ตัวแทนและคิสเลอร์ได้คาดการณ์ว่าการปรากฏตัวของบริเวณที่มีการทำซ้ำสูงซึ่งมีทรานสโปซอนอาจส่งเสริมการกลายพันธุ์ของยีนเอฟเฟกเตอร์ที่มีถิ่นที่อยู่ [29] ดังนั้น การมีอยู่ของยีนเอฟเฟกเตอร์ภายในภูมิภาคดังกล่าวจึงแนะนำให้ส่งเสริมการปรับตัวและการกระจายความหลากหลายเมื่อเผชิญกับแรงกดดันในการคัดเลือกที่รุนแรง [30]

ตามธรรมเนียมการกลายพันธุ์ของ RIP นั้นถูกจำกัดอยู่เฉพาะบริเวณที่เกิดซ้ำและไม่ใช่บริเวณที่ทำสำเนาเดียว Fudal และคณะ [31] แนะนำว่าการรั่วไหลของการกลายพันธุ์ RIP อาจเกิดขึ้นภายในระยะทางสั้น ๆ ของการทำซ้ำที่ได้รับผลกระทบจาก RIP อันที่จริงสิ่งนี้ได้รับการรายงานใน น. crassa โดยที่ตรวจพบการรั่วไหลของ RIP ในลำดับสำเนาเดียวอย่างน้อย 930 bp จากขอบเขตของลำดับที่ซ้ำกันที่อยู่ใกล้เคียง [32] เพื่ออธิบายกลไกการตรวจจับของลำดับซ้ำที่นำไปสู่ ​​RIP อาจช่วยให้เข้าใจว่าลำดับขนาบข้างอาจได้รับผลกระทบเช่นกัน

กลไกการแก้ไข

RIP ทำให้เกิดการกลายพันธุ์ของการเปลี่ยนแปลง G:C เป็น A:T ภายในการทำซ้ำ อย่างไรก็ตาม กลไกที่ตรวจจับลำดับที่ซ้ำกันนั้นไม่เป็นที่รู้จัก RID เป็นโปรตีนเพียงชนิดเดียวที่จำเป็นสำหรับ RIP เป็นโปรตีนคล้าย DNA methyltransferease ซึ่งเมื่อกลายพันธุ์หรือทำให้แตกออกจะส่งผลให้สูญเสีย RIP [33] การลบของ กำจัด คล้ายคลึงกันใน แอสเปอร์จิลลัส นิดูลานส์, dmtAส่งผลให้สูญเสียการเจริญพันธุ์ [34] ในขณะที่ลบ กำจัด คล้ายคลึงกันใน Ascobolus immersens, masc1ส่งผลให้เกิดข้อบกพร่องในการเจริญพันธุ์และการสูญเสียเมทิลเลชั่นที่เหนี่ยวนำให้เกิด premeiotically (MIP) [35]

ผลที่ตามมาแก้ไข

เชื่อกันว่า RIP มีวิวัฒนาการมาเป็นกลไกในการป้องกันองค์ประกอบที่เคลื่อนย้ายได้ ซึ่งคล้ายกับปรสิตโดยการบุกรุกและทวีคูณภายในจีโนม RIP สร้างการกลายพันธุ์ที่ผิดพลาดและไร้สาระหลายครั้งในลำดับการเข้ารหัส ไฮเปอร์มิวเทชันของ G-C ถึง A-T ในลำดับซ้ำ ๆ นี้จะกำจัดผลิตภัณฑ์ยีนเชิงฟังก์ชันของลำดับ (หากมีสิ่งใดที่จะเริ่มต้นด้วย) นอกจากนี้ นิวคลีโอไทด์ที่มีแบริ่ง C จำนวนมากกลายเป็นเมทิลเลต ดังนั้นจึงลดการถอดรหัสลง

ใช้ในอณูชีววิทยา Edit

เนื่องจาก RIP มีประสิทธิภาพมากในการตรวจจับและการกลายพันธุ์ซ้ำ นักชีววิทยาของเชื้อราจึงมักใช้เครื่องมือนี้เป็นเครื่องมือในการทำให้เกิดการกลายพันธุ์ สำเนาที่สองของยีนสำเนาเดียวจะถูกแปลงเป็นจีโนมก่อน จากนั้นเชื้อราจะต้องผสมพันธุ์และผ่านวงจรทางเพศเพื่อกระตุ้นกลไก RIP การกลายพันธุ์ที่แตกต่างกันจำนวนมากภายในยีนที่ทำซ้ำนั้นได้มาจากเหตุการณ์การปฏิสนธิเพียงครั้งเดียว ดังนั้นอัลลีลที่ถูกระงับการใช้งานมักจะเกิดจากการกลายพันธุ์ที่ไร้สาระ เช่นเดียวกับอัลลีลที่มีการกลายพันธุ์ที่ผิดพลาด (36)

กระบวนการสืบพันธุ์แบบเซลล์ของไมโอซิสถูกค้นพบโดย Oscar Hertwig ในปี 1876 ไมโทซิสถูกค้นพบในอีกหลายปีต่อมาในปี 1882 โดย Walther Flemming

Hertwig ศึกษาเม่นทะเล และสังเกตว่าไข่แต่ละฟองมีนิวเคลียสหนึ่งตัวก่อนการปฏิสนธิและอีกสองนิวเคลียสหลังจากนั้น การค้นพบนี้พิสูจน์ว่าอสุจิตัวหนึ่งสามารถปฏิสนธิกับไข่ได้ และด้วยเหตุนี้จึงพิสูจน์ให้เห็นถึงกระบวนการของไมโอซิส Hermann Fol ดำเนินการวิจัยต่อของ Hertwig โดยการทดสอบผลของการฉีดอสุจิหลายตัวเข้าไปในไข่ และพบว่ากระบวนการนี้ใช้ไม่ได้กับตัวอสุจิมากกว่าหนึ่งตัว [37]

เฟลมมิงเริ่มการวิจัยเกี่ยวกับการแบ่งเซลล์ในปี พ.ศ. 2411 การศึกษาเกี่ยวกับเซลล์เป็นหัวข้อที่ได้รับความนิยมมากขึ้นเรื่อยๆ ในช่วงเวลานี้ ในปี พ.ศ. 2416 ชไนเดอร์ได้เริ่มอธิบายขั้นตอนการแบ่งเซลล์แล้ว เฟลมมิงอธิบายเพิ่มเติมในปี พ.ศ. 2417 และ พ.ศ. 2418 ขณะที่เขาอธิบายขั้นตอนโดยละเอียดมากขึ้น เขายังโต้เถียงกับการค้นพบของชไนเดอร์ว่านิวเคลียสแยกออกเป็นโครงสร้างคล้ายแท่งโดยบอกว่าจริง ๆ แล้วนิวเคลียสแยกออกเป็นเกลียวที่แยกจากกัน เฟลมมิงสรุปว่าเซลล์ทำซ้ำผ่านการแบ่งเซลล์ เพื่อให้มีการแบ่งเซลล์แบบเฉพาะเจาะจงมากขึ้น [38]

Matthew Meselson และ Franklin Stahl ได้รับการยกย่องว่าเป็นผู้ค้นพบการจำลองดีเอ็นเอ วัตสันและคริกยอมรับว่าโครงสร้างของดีเอ็นเอบ่งชี้ว่ามีกระบวนการจำลองแบบบางรูปแบบ อย่างไรก็ตาม ยังไม่มีการวิจัยเกี่ยวกับดีเอ็นเอด้านนี้มากนัก จนกระทั่งหลังจากวัตสันและคริก ผู้คนพิจารณาวิธีการที่เป็นไปได้ทั้งหมดในการพิจารณากระบวนการจำลองแบบของ DNA แต่ไม่มีใครประสบความสำเร็จจนกระทั่ง Meselson และ Stahl เมเซลสันและสตาห์ลแนะนำไอโซโทปหนักเข้าไปในดีเอ็นเอบางตัวและติดตามการกระจายของไอโซโทป จากการทดลองนี้ Meselson และ Stahl สามารถพิสูจน์ได้ว่า DNA มีการสืบพันธุ์แบบกึ่งอนุรักษ์นิยม [39]


โครงสร้างโปรตีน

สำหรับภาพประกอบเชิงโต้ตอบของระดับโครงสร้างโปรตีน ให้ดูการจำลองการพับโปรตีนโดย LabXchange ซึ่งใช้เฮโมโกลบินเป็นตัวอย่างและอธิบายโครงสร้างโมเลกุลโดยละเอียดยิ่งขึ้น

ดังที่ได้กล่าวไว้ข้างต้น รูปร่างของโปรตีนมีความสำคัญต่อการทำงานของมัน ตัวอย่างเช่น เอนไซม์สามารถจับกับซับสเตรตจำเพาะที่ไซต์แอคทีฟ หากไซต์ที่ทำงานอยู่นี้มีการเปลี่ยนแปลงเนื่องจากการเปลี่ยนแปลงในท้องถิ่นหรือการเปลี่ยนแปลงในโครงสร้างโปรตีนโดยรวม เอนไซม์อาจไม่สามารถจับกับซับสเตรตได้ เพื่อให้เข้าใจว่าโปรตีนได้รับรูปร่างหรือรูปแบบสุดท้ายอย่างไร เราต้องเข้าใจโครงสร้างโปรตีนสี่ระดับ: ประถมศึกษา มัธยมศึกษา อุดมศึกษา และควอเทอร์นารี ดูภาพด้านล่างและคลิกที่จุดข้อมูล (ที่มีเครื่องหมาย “i”) เพื่อดูคำอธิบาย

ดังที่เห็นในภาพด้านบน เส้นใยของกรดอะมิโนจะพับเข้าหากัน ทำให้เกิดรูปร่างที่เป็นเอกลักษณ์ในโครงสร้างระดับตติยภูมิของโปรตีน ซึ่งเกิดจากคุณสมบัติทางเคมีของกรดอะมิโน คุณสมบัติทางเคมีของกรดอะมิโนเป็นตัวกำหนดว่ารูปร่างนี้เกิดขึ้นได้อย่างไร ตัวอย่างเช่น กรดอะมิโนแต่ละชนิดมีประจุลบ (-), บวก (+) หรือเป็นกลาง (N) กรดอะมิโนที่มีประจุลบจับกับกรดอะมิโนที่มีประจุบวก (ไม่มีผลกระทบต่อกรดอะมิโนที่มีประจุเป็นกลาง) นอกจากนี้ กรดอะมิโนที่เรียกว่าซิสเทอีนยังมีกำมะถันและกำมะถันเกาะติดกันได้ง่าย ทำให้เกิด "พันธะไดซัลไฟด์" ด้วยเหตุนี้ซีสเตอีนจึงจับกับซีสเตอีนอื่น ดูตารางด้านล่างสำหรับรายการกรดอะมิโนทั้งหมด 20 ชนิดและประจุของกรดอะมิโน มีคุณสมบัติอื่นๆ ที่ส่งผลต่อรูปร่างของโปรตีนด้วย เช่น ขั้วของกรดอะมิโน โปรดทราบว่าพันธะเหล่านี้ไม่แข็งแรงเท่ากับที่ถูกสร้างขึ้นระหว่างกรดอะมิโนเมื่อสร้างสายโซ่กรดอะมิโน แต่พันธะเหล่านี้แข็งแรงพอที่จะรักษารูปร่างในโปรตีน

กรดอะมิโน อักษรย่อ 3 ตัว ตัวย่อ 1 ตัวอักษร ค่าใช้จ่าย การเกิดพันธะไดซัลไฟด์?
อะลานีน อะลา NS เป็นกลาง
อาร์จินีน Arg NS (+)
หน่อไม้ฝรั่ง อัสนี NS เป็นกลาง
แอสปาเทต (กรดแอสปาร์ติก) งูเห่า NS (-)
ซีสเตอีน Cys เป็นกลาง ใช่
กลูตามีน Gln NS เป็นกลาง
กลูตาเมต (กรดกลูตามิก) กลู อี (-)
ไกลซีน Gly NS เป็นกลาง
ฮิสติดีน ของเขา ชม (+)
ไอโซลิวซีน อิเล ผม เป็นกลาง
ลิวซีน หลิว หลี่ เป็นกลาง
ไลซีน ลิซ K (+)
เมไทโอนีน พบ NS เป็นกลาง
ฟีนิลอะลานีน เพ NS เป็นกลาง
โพรลีน มือโปร NS เป็นกลาง
ซีรีน เซอร์ NS เป็นกลาง
ธรีโอนีน ผ่าน NS เป็นกลาง
ทริปโตเฟน Trp W เป็นกลาง
ไทโรซีน Tyr Y เป็นกลาง
วาลีน วาล วี เป็นกลาง

ใช้แผนภูมิด้านบนเพื่อพิจารณาว่ากรดอะมิโนใดที่อาจจับกันเพื่อสร้างโครงสร้างระดับอุดมศึกษา

นี่คือตัวอย่างของแบบจำลองโพลีเปปไทด์ที่แสดงให้เห็นว่าประจุมีอิทธิพลต่อโครงสร้างระดับอุดมศึกษาอย่างไร ภาพแรกและภาพที่สองเหมือนกัน ยกเว้นภาพที่สองมีจุดที่มีข้อมูลเพิ่มเติมที่มีเครื่องหมายคำถาม (?) คีย์ที่ด้านล่างของรูปภาพจำเป็นสำหรับการตีความรูปภาพ


เพื่อให้เข้าใจเวิร์กชีตการสังเคราะห์โปรตีนของคุณดีที่สุด เรามาพูดถึงกระบวนการสังเคราะห์โปรตีนทั้งหมดกัน มันเริ่มต้นด้วยการถอดความ เอ็นไซม์พิเศษในนิวเคลียสมาถึงเพื่อดึงรหัสดีเอ็นเอที่จำเป็นออกจากกันอย่างนุ่มนวล และอาร์เอ็นเอก็เริ่มถ่ายทอดหรือเขียนสารพันธุกรรมใหม่

ในระหว่างการแปล mRNA จะเชื่อมต่อกับไรโบโซมและข้อมูลของมันถูกถอดรหัสอีกครั้งเพื่อให้ลำดับกรดอะมิโนที่ถูกต้องเชื่อมต่อกันเพื่อสร้างโพลีเปปไทด์ สิ่งสำคัญที่ควรทราบคือ ไรโบโซมไม่ได้สร้างโปรตีนและไม่สร้างกรดอะมิโน มันเพียงแต่สั่งกรดอะมิโนที่สร้างไว้แล้วให้สร้างลำดับที่ถูกต้อง

ลำดับของกรดอะมิโนกำหนดรูปร่าง หน้าที่ และคุณสมบัติของโปรตีน และสามารถทำได้ด้วยเบสทั้งสี่ของอาร์เอ็นเอ (ซึ่งทั้งหมดเป็นนิวคลีโอไทด์): อะดีนีน (A), ไซโตซีน (C), กัวนีน (G) และยูราซิล (ยู). codon ตามที่เราอธิบายไว้ก่อนหน้านี้คือการรวมกันของสามฐานเหล่านี้ในลำดับเฉพาะ: UUC เป็นต้น

โคดอนบางตัวบอกให้ไรโบโซมเริ่มหรือหยุด (UAA, UAG และ UGA หมายถึงหยุด) และส่วนที่เหลือระบุถึงกรดอะมิโนจำเพาะ


ผลลัพธ์

คุณลักษณะลำดับที่เกี่ยวข้องกับการเริ่มต้นการแปล:

ลำดับ Shine–Dalgarno:

เพื่อตรวจสอบผลกระทบของลำดับ SD เราต้องแน่ใจว่ากลไกของการเริ่มต้นการแปลนั้นยังมีอยู่ใน ง. หยาบคาย. เพื่อยืนยันสิ่งนี้ เราได้คำนวณพลังงานอิสระเฉลี่ยอย่างเป็นระบบของการจับคู่เบสที่เป็นไปได้ของหาง 16S rRNA 3′ และต้นน้ำของ ง. หยาบคาย ยีนด้วยวิธีพลังงานอิสระ (โอ สะเดา) et al. พ.ศ. 2542) พลังงานอิสระลดลงอย่างรวดเร็วในบริเวณ −25– ∼ −5 ในทุกยีนใน ง. หยาบคาย โครโมโซมและเมกาพลาสมิด (รูปที่ 1) แนวโน้มนี้มีความคล้ายคลึงกันอย่างมากกับสิ่งที่สังเกตได้ใน อี. โคไล (โอ สะเดา et al. พ.ศ. 2542) แสดงว่าวิธีการของโอซาดะใช้ได้ผลดีใน ง. หยาบคาย เช่นกัน. นอกจากนี้ยังบ่งชี้ว่ามีการใช้กลไกเดียวกันในการเริ่มต้นการแปลใน ง. หยาบคาย เช่นเดียวกับในโปรคาริโอตส่วนใหญ่ ที่น่าสนใจคือพลังงานอิสระเฉลี่ยตามตำแหน่งต่ำกว่าใน ง. หยาบคาย กว่าใน อี. โคไล (รูปที่ 1) ซึ่งอาจเกิดจากองค์ประกอบ GC สูงของ ง. หยาบคาย จีโนม

พลังงานอิสระลดลงอย่างรวดเร็วรอบตำแหน่ง -25 และ -5 (เทียบกับโคดอนเริ่มต้น) ใน ง. หยาบคาย (DVU) และเมตาพลาสมิดของ ง. หยาบคาย (DVUA) และใน อี. โคไล (อีโคลี). พลังงานอิสระของยีนทั้งหมดในแต่ละโครโมโซมถูกหาค่าเฉลี่ยตามตำแหน่ง

โดยใช้กรรมวิธีพลังงานฟรีแบบเดียวกัน (โอ สะเดา) et al. 1999) เราคำนวณ MFE ของการจับคู่ฐาน 16S rRNA–SD สำหรับทุกคน ง. หยาบคาย ยีน อย่างที่คาดไว้ ความยาวของหาง 16S sRNA 3′ และลำดับต้นน้ำอาจส่งผลต่อค่าพลังงานอิสระที่คำนวณได้ เพื่อทดสอบผลกระทบนี้ เราเลือกความยาวสามช่วง (13, 20 และ 23) ของหาง 16S rRNA 3′ และสองความยาว (25 และ 50) ของลำดับต้นน้ำ mRNA และคำนวณ MFE สำหรับชุดค่าผสมต่างๆ นอกจากวิธีการแบบใช้พลังงานอิสระแล้ว เรายังใช้วิธีความน่าจะเป็นในการวัดค่าความแข็งแกร่งของ RBS (S uzek et al. 2544). พบลำดับ SD สมมุติที่มีคะแนน RBS สูงกว่าค่าเกณฑ์ (S uzek et al. 2544). ผลการวิจัยพบว่าการมีส่วนร่วมมีความหลากหลายมากในวิธีการต่างๆ ของการคำนวณ SD MFE โดย MFE20_50 (20 หมายถึงความยาวของหาง 16S rRNA 3′ และ 50 หมายถึงความยาวของลำดับต้นน้ำของยีน) ซึ่งอธิบายการแปรผันสูงสุดใน mRNA– ความสัมพันธ์ของโปรตีน (มากถึง 1.9–3.8% ระหว่างชุดข้อมูลต่างๆ NS-value <0.001 ตารางที่ 1 , ตารางเสริม 1 ที่ http://www.genetics.org/supplemental/) ผลลัพธ์นี้ยังแสดงให้เห็นว่าเอฟเฟกต์ SD ที่คำนวณโดยวิธีความน่าจะเป็นนั้นดูเหมือนจะไม่ได้อธิบายความผันแปรในความสัมพันธ์ของ mRNA กับโปรตีนมากนัก (ส่วนใหญ่ ∼1.0% ตารางเพิ่มเติมที่ 1) นอกจากนี้ พบว่ามีความสัมพันธ์ที่อ่อนแอระหว่างคะแนน RBS และ MFE20_50 เท่านั้น (NS = −0.27, NS < 0.0001) แสดงว่าวิธีการทั้งสองนี้อาจต่างกันในการประเมินลำดับ SD ในการศึกษาต่อจากนี้ MFE20_50 ถูกใช้ในการวิเคราะห์ทั้งหมดที่เกี่ยวข้อง

การมีส่วนร่วมของคุณสมบัติต่างๆ ในการแปรผันรวมของความสัมพันธ์ของ mRNA–โปรตีน

การศึกษาล่าสุดของ อี. โคไล แสดงให้เห็นว่าค่า SD MFE ในยีนที่แสดงออกอย่างสูง (หมายถึงยีนที่สามารถตรวจพบผลิตภัณฑ์โปรตีนบนเจล 2 มิติ) ต่ำกว่าในยีนอื่นๆ (L ithwick และ M argalit 2003) ก่อนหน้านี้เราพบว่า ง. หยาบคาย โปรตีนที่ตรวจพบโดย LC–MS/MS แสดงถึงยีนที่แสดงออกอย่างมาก (รูปที่ 1 เสริมที่ http://www.genetics.org/supplemental/ Z hang et al. 2006c) เมื่อเปรียบเทียบค่า MFE20_50 ของโปรตีนที่ตรวจพบกับโปรตีนทั้งหมดใน ง. หยาบคาย จีโนม พบรูปแบบการกระจายความถี่ที่คล้ายคลึงกัน (รูปที่ 2) ซึ่งบ่งชี้ว่าโดยรวมแล้วไม่มีหลักฐานที่แน่ชัดสำหรับ MFE ที่ต่ำกว่าในโปรตีนที่ระบุใน LC–MS/MS

การกระจายความถี่ของการโต้ตอบ SD–rRNA พลังงานอิสระขั้นต่ำสำหรับทุกคน ง. หยาบคาย โปรตีนและโปรตีนที่ระบุในสามสภาวะการเจริญเติบโต LL, เฟสแลกเทต-ล็อก FL, เฟสล็อกรูปแบบ LS, เฟสแลกเทต-นิ่ง

ก่อนหน้านี้เราพบว่าความสัมพันธ์ระหว่าง mRNA กับโปรตีนอาจแตกต่างกันในหมวดหมู่การทำงานต่างๆ (N ie et al. 2549ก) จากข้อเท็จจริงที่ว่าค่า MFE อาจเกี่ยวข้องกับการแสดงออกของ mRNA และความอุดมสมบูรณ์ของโปรตีน คำถามหนึ่งข้อคือ ค่า MFE ยังแปรผันตามหมวดหมู่การทำงานของยีน/โปรตีนที่กำหนดหรือไม่ ผลการวิจัยพบว่าในขณะที่หมวดหมู่การทำงานส่วนใหญ่มีค่า MFE เท่ากัน ยีนจากหมวดหมู่การทำงานหลายประเภท เช่น การสังเคราะห์กรดอะมิโน การเมตาบอลิซึมจากส่วนกลาง เมแทบอลิซึมของพลังงาน ชะตากรรมของโปรตีน และการสังเคราะห์โปรตีน มีค่า MFE ที่ต่ำกว่า (รูปที่ 3 หมวด 1) รูปแบบนี้ดูเหมือนจะสอดคล้องกันเมื่อเราใช้ยีนที่สอดคล้องกันของโปรตีนที่ระบุภายใต้สภาวะการเจริญเติบโตทั้งสามที่ตรวจสอบในการศึกษานี้ (รูปที่ 3 หมวดหมู่ II, III และ IV)

พลังงานอิสระขั้นต่ำของปฏิกิริยา SD–rRNA ของยีนที่อยู่ในหมวดหมู่การทำงานต่างๆ: (I) ยีนทั้งหมด (II) สภาวะแลคเตท-ล็อก, (III) สภาวะฟอร์เมท-ล็อก และ (IV) สภาวะแลคเตท-นิ่ง หมวดหมู่การทำงานของเซลล์คือ: A, การสังเคราะห์กรดอะมิโน B, การสังเคราะห์โคแฟคเตอร์และพาหะ C, เปลือกเซลล์ D, กระบวนการของเซลล์ E, เมแทบอลิซึมกลาง F, เมแทบอลิซึมของ DNA G, กรอบการอ่านที่หยุดชะงัก H, เมแทบอลิซึมของพลังงาน I, กรดไขมันและฟอสโฟลิปิด metabolism J, hypothetical proteins K, other categories L, protein fate M, protein synthesis N, biosynthesis of purines and pyrimidines O, regulatory functions P, signal transduction Q, transcription R, transport and binding proteins and S, unknown function. The functional categories without any proteins detected are left blank in II, III, and IV. The central, top, and bottom horizontal lines in the plots represent the mean, plus and minus the standard deviation for each function category.

Start codons:

ใน D. vulgaris genome, the start codon ATG is the most frequent start codon, consistent with the early conclusion that ATG is a preferred start codon, independent of the G + C content (R ocha et al. 1999). Approximately 82% of the D. vulgaris genes start with this codon, while the less frequently used TTG and GTG codons are found in 5.4 and 13% of the genes (Figure 4A). This strong bias in start codons was also observed in the proteins detected in various growth conditions (Figure 4A). This observation confirms that the canonical start codon ATG is more translationally optimal than noncanonical start codons. However, overall, the start codon identity explained only 0.1–0.7% of the total variation in mRNA–protein relationship under the three growth conditions as indicated by regression analyses (Table 1).

(A) Frequency distribution of start codon usage in all D. vulgaris proteins and proteins identified from three growth conditions. (B) Frequency distribution of minimum free energy of predicted mRNA secondary structure at start codon context of all D. vulgaris proteins and proteins identified from three growth conditions.

Start codon context:

Studies showed that stem–loop structures formed at the start site can affect the accessibility of the SD sequence or start codon for ribosomal binding ( de S mit and V an D uin 1990, 1994 R ocha et al. 1999). To determine the potential effects of these mRNA secondary structures on protein translation, we computed the minimum free energy for the 60-base sequences spanning the start codon with RNAfold (H ofacker 2003 H ofacker and S tadler 2006). We found that proteins detected in our study tend to have relative high MFE values compared with all proteins in the D. vulgaris genome (Figure 4B), suggesting that avoidance of mRNA secondary structure might be a strategy for genes to achieve a high translation rate. Overall, the start codon context explains 0.3–2.5% of the variation in mRNA–protein correlation under the three growth conditions (Table 1), which is larger than that by start codons alone.

Sequence features related to translation elongation:

Codon usage pattern:

The codon usage in the G + C-rich D. vulgaris genome has not been fully investigated before (H eidelberg et al. 2004). In this study, two approaches have been employed to investigate the unequal codon usage in D. vulgaris. The first approach is to compare the extent of codon usage deviated from the expected frequency between detected proteins and all proteins to determine which codon is associated with protein translation. Due to the high GC composition of the D. vulgaris genome, the observed unequal frequency of synonymous codons can be simply a result of biased base composition due to mutational bias (K night et al. 2001). Therefore, we used POD to measure how much the observed codon frequency deviated from the expected frequency determined on the basis of the base composition alone. Briefly, a positive POD value suggests an overrepresentation of the codon, whereas a negative POD indicates an underrepresentation. If the codon usage is associated with gene expression level, we would expect to see significantly different POD values between detected proteins and all proteins. Indeed, we found that except for Glu and Val codon families, the POD values of at least 1 codon within all the other 16 sense codon families (Met and Trp are excluded because they have only 1 codon) were significantly different (P-values <0.0001) between detected proteins and all proteins (Figure 5, A and B). In most cases, the absolute values of POD are greater in detected proteins than in all proteins, suggesting a stronger bias for these codons in detected proteins. This observation is consistent with previous findings in อี. โคไล และ Saccharomyces cerevisiae (I kemura 1981, 1982, 1985). Taken together, it is obvious that codon usage in D. vulgaris is strongly associated with protein expression.

Comparison of the preferences of synonymous codon usage between all D. vulgaris proteins and proteins identified from three growth conditions. (A) Twofold codon families. (B) Multifold codon families.

The second approach is a correspondence analysis of the RSCU. The first four major trends in codon usage (CR1 to -4) determined by correspondence analysis accounted for 17.1, 4.4, 3.9, and 3.7% of the total variations in RSCU of all D. vulgaris genes (W u et al. 2006). We included the first four major axes in codon usage of the D. vulgaris genome in a multiple-regression analysis. The result showed that codon usage alone contributed to 5.3–15.7% of the total variation in mRNA–protein correlation under the three conditions (NS-value <0.001) (Table 1).

Amino acid usage:

It was observed that the usage of some amino acids was correlated with gene expression (A kashi 2003 C handa et al. 2005 S chaber et al. 2005). To determine whether it is the same case for amino acid usage in D. vulgaris, we applied a similar approach to the one used for codon usage, as described in the previous section. The only difference was that this time the frequencies of all synonymous codons were summed. Therefore, if the usage of an amino acid is associated with protein expression, we expect the POD value of this amino acid in detected proteins to be different from that in all proteins. As expected, the POD values of amino acids Asn, Asp, Glu, Ile, Tyr, and Lys in detected proteins are significantly higher than those in all proteins (NS-values <0.0001 for all these amino acids) (Figure 6), suggesting that these amino acids are preferred in more abundant proteins.

Comparison of the preferences of amino acid usage between all D. vulgaris proteins and proteins identified from three growth conditions.

Given the fact that amino acid usage in D. vulgaris does associate with protein expression, we employed a multiple-regression analysis to determine its relative contribution to mRNA–protein correlation. A correspondence analysis of the deduced protein sequences of 3522 genes in D. vulgaris was performed to reveal the major trends. The first four trends (AA1 to -4) identified by correspondence analysis explain 18.6, 11.5, 9.7, and 7.0% of the variability in D. vulgaris amino acid usage, respectively (W u et al. 2006). When we included the first four major axes in amino acid usage of the D. vulgaris genome in a multiple-regression analysis, the result showed that amino acid usage alone contributed to 5.8–11.9% of the total variation in mRNA–protein correlation under the three growth conditions (NS-value <0.001) (Table 1).

Sequence features related to translation termination:

Stop codons:

ใน D. vulgaris, three types of stop codons are all commonly used, with ∼45, 41, and 14% among all genes for TGA, TAG, and TAA, respectively (Figure 7A). However, among the proteins detected under our three growth conditions, TAG seems to be the most preferred stop codon: ∼56–59% of protein-encoding genes use TAG as a stop codon (Figure 7A). Regression analysis showed that stop codon identity was an important feature affecting mRNA–protein correlation. It alone explained 1.3–2.3% of total variation in mRNA–protein correlation under the three growth conditions (Table 1).

(A) Frequency distribution of stop codon usage in all D. vulgaris proteins and proteins identified from three growth conditions. (B) Frequency distribution of tetranucleotide termination signals in all D. vulgaris proteins and proteins identified from three growth conditions.

Stop codon context:

The base immediately downstream of the stop codon was also investigated for its role in translation termination. ใน D. vulgaris, “C” appears to be preferred after all three stop codons (Figure 7B). The most frequent stop signal is TAGC, which is even higher in proteins identified under the three conditions, suggesting that it might be the optimal stop signal. Simple regression analysis confirmed that stop codon context was an important feature affecting mRNA–protein correlation. It alone contributed 3.7–5.1% of total variation in mRNA–protein correlation under the three growth conditions (Table 1).

Multiple-regression analysis:

To quantitatively determine the relative contribution of each translation efficiency-related feature on mRNA–protein correlation, all sequence features studied above were integrated into a multiple-regression analysis. The results showed that these features together accounted for ∼15.2–26.2% of the total variation in mRNA–protein correlation (Table 1). NS NS-values of this regression model, for all three conditions, are all <0.00001, which indicates that contribution of these features to the mRNA–protein variation is significant. In addition, the result is very consistent under all three growth conditions.

To further evaluate the multiple-regression model itself, and to verify the sincerity of the contribution resulting from this multiple regression, we ran two bootstrap tests by keeping sequence features unchanged for all genes, while randomly permuting their proteomic abundance among the genes so that the proteomic abundance of a given gene is randomly assigned to a different gene. The bootstrap tests were run by randomly selecting 1000 permutations for each test. For each permutation, a multiple regression was fitted and was reported as we did for the real data. The bootstrap NS-value is reported as the probability that the simulated is larger than the associated with the real data. A smaller NS-value suggests that the obtained for the real model is statistically more significant. The two null models for the bootstrap tests were that (1) the contribution by mRNA levels and all sequence features is not larger than the mRNA level alone and (2) the contribution by mRNA levels and all sequence features is no larger than that by mRNA levels and initiation-related sequence features (excluding elongation- and termination-related sequence features), respectively. The results showed that the NS-values from the first bootstrap analysis are 0 for the contributions computed under all three growth conditions, and the NS-value for the second null hypothesis is <0.0001 for all three conditions. The results demonstrated that correlation of mRNA expression and protein abundance was affected at a fairly significant level by multiple sequence features related to translational efficiency in D. vulgaris. Among them, the amino acid usage and codon usage are the top two factors, followed by stop codon context and SD sequences (Table 1).


9.6 | รหัสพันธุกรรม

กระบวนการถอดความในระดับเซลล์จะสร้าง RNA ของผู้ส่งสาร (mRNA) ซึ่งเป็นสำเนาโมเลกุลเคลื่อนที่ของยีนตั้งแต่หนึ่งตัวขึ้นไปที่มีตัวอักษร A, C, G และ uracil (U) การแปลเทมเพลต mRNA จะแปลงข้อมูลทางพันธุกรรมที่มีนิวคลีโอไทด์เป็นผลิตภัณฑ์โปรตีน Protein sequences consist of 20 commonly occurring amino acids therefore, it can be said that the protein alphabet consists of 20 letters (Figure 9.21). กรดอะมิโนแต่ละตัวถูกกำหนดโดยลำดับสามนิวคลีโอไทด์ที่เรียกว่าทริปเล็ตโคดอน กรดอะมิโนที่ต่างกันมีเคมีที่แตกต่างกัน (เช่น กรดกับด่าง หรือแบบมีขั้วและไม่มีขั้ว) และข้อจำกัดทางโครงสร้างที่แตกต่างกัน Variation in amino acid sequence gives rise to enormous variation in protein structure and function.

Figure 9.21 Structures of the 20 amino acids found in proteins are shown. Each amino acid is composed of an amino group ( NH + 3 ), a carboxyl group (COO – ), and a side chain (blue). The side chain may be nonpolar, polar, or charged, as well as large or small. It is the variety of amino acid side chains that gives rise to the incredible variation of protein structure and function.

หลักความเชื่อ: DNA เข้ารหัส RNA RNA เข้ารหัสโปรตีน

The flow of genetic information in cells from DNA to mRNA to protein is described by the Central Dogma (Figure 9.22), which states that genes specify the sequence of mRNAs, which in turn specify the sequence of proteins. การถอดรหัสของโมเลกุลหนึ่งไปยังอีกโมเลกุลหนึ่งดำเนินการโดยโปรตีนและอาร์เอ็นเอจำเพาะ เนื่องจากข้อมูลที่เก็บไว้ใน DNA เป็นศูนย์กลางของการทำงานของเซลล์ มันจึงสมเหตุสมผลโดยสัญชาตญาณว่าเซลล์จะทำสำเนา mRNA ของข้อมูลนี้เพื่อการสังเคราะห์โปรตีน ในขณะที่รักษา DNA ไว้เหมือนเดิมและได้รับการปกป้อง การคัดลอก DNA ไปยัง RNA นั้นค่อนข้างตรงไปตรงมา โดยมีการเพิ่มนิวคลีโอไทด์หนึ่งตัวไปยังสาย mRNA สำหรับทุกนิวคลีโอไทด์ที่อ่านในสายดีเอ็นเอ การแปลเป็นโปรตีนซับซ้อนกว่าเล็กน้อยเนื่องจากนิวคลีโอไทด์ mRNA สามตัวสอดคล้องกับกรดอะมิโนหนึ่งตัวในลำดับโพลีเปปไทด์ However, the translation to protein is still systematic and colinear, such that nucleotides 1 to 3 correspond to amino acid 1, nucleotides 4 to 6 correspond to amino acid 2, and so on.

Figure 9.22 Instructions on DNA are transcribed onto messenger RNA. Ribosomes are able to read the genetic information inscribed on a strand of messenger RNA and use this information to string amino acids together into a protein.

รหัสพันธุกรรมเสื่อมลงและเป็นสากล

Given the different numbers of “letters” in the mRNA and protein “alphabets,” scientists theorized that combinations of nucleotides corresponded to single amino acids. Nucleotide doublets would not be sufficient to specify every amino acid because there are only 16 possible two-nucleotide combinations(4 2 ).

ในทางตรงกันข้าม มีนิวคลีโอไทด์แฝดสามที่เป็นไปได้ (4 3 ) ซึ่งมากกว่าจำนวนกรดอะมิโนมาก Scientists theorized that amino acids were encoded by nucleotide triplets and that the genetic code was เสื่อมโทรม. กล่าวอีกนัยหนึ่ง กรดอะมิโนที่กำหนดสามารถเข้ารหัสโดยทริปเปิ้ลนิวคลีโอไทด์มากกว่าหนึ่งตัว This was later confirmed experimentally Francis Crick and Sydney Brenner used the chemical mutagen proflavin to insert one, two, or three nucleotides into the gene of a virus. When one or two nucleotides were inserted, protein synthesis was completely abolished. เมื่อใส่นิวคลีโอไทด์สามตัวเข้าไป โปรตีนจะถูกสังเคราะห์และทำหน้าที่ This demonstrated that three nucleotides specify each amino acid. These nucleotide triplets are called codons. The insertion of one or two nucleotides completely changed the triplet reading frame, thereby altering the message for every subsequent amino acid (Figure 9.24). Though insertion of three nucleotides caused an extra amino acid to be inserted during translation, the integrity of the rest of the protein was maintained.Scientists painstakingly solved the genetic code by translating synthetic mRNAs in vitro and sequencing the proteins they specified (Figure 9.23.

Figure 9.23 This figure shows the genetic code for translating each nucleotide triplet in mRNA into an amino acid or a termination signal in a nascent protein. (credit: modification of work by NIH)

รหัสพันธุกรรมเป็นสากล With a few exceptions, virtually all species use the same genetic code for protein synthesis. การอนุรักษ์โคดอนหมายความว่า mRNA ที่บริสุทธิ์ซึ่งเข้ารหัสโปรตีนโกลบินในม้าสามารถถ่ายโอนไปยังเซลล์ดอกทิวลิป และดอกทิวลิปจะสังเคราะห์โกลบินของม้า มีรหัสพันธุกรรมเพียงรหัสเดียวเป็นหลักฐานอันทรงพลังที่แสดงว่าสิ่งมีชีวิตทั้งหมดบนโลกมีต้นกำเนิดร่วมกัน โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่ามีกรดอะมิโน 20 ชนิดที่เป็นไปได้ประมาณ 10 84 ตัวและโคดอน 64 ตัว

Transcribe a gene and translate it to protein using complementary pairing and the genetic code at this site (http://openstaxcollege.org/l/create_protein) .

Figure 9.25 The deletion of two nucleotides shifts the reading frame of an mRNA and changes the entire protein message, creating a nonfunctional protein or terminating protein synthesis altogether.

เชื่อกันว่าความเสื่อมเป็นกลไกของเซลล์เพื่อลดผลกระทบเชิงลบของการกลายพันธุ์แบบสุ่ม โคดอนที่ระบุกรดอะมิโนตัวเดียวกันโดยทั่วไปจะต่างกันเพียงนิวคลีโอไทด์เดียวเท่านั้น นอกจากนี้ กรดอะมิโนที่มีสายโซ่ด้านข้างที่คล้ายคลึงกันทางเคมีจะถูกเข้ารหัสโดยโคดอนที่คล้ายคลึงกัน This nuance of the genetic code ensures that a single-nucleotide substitution mutation might either specify the same amino acid but have no effect or specify a similar amino acid, preventing the protein from being rendered completely nonfunctional.


Name two reasons why it is impossible to determine a gene's nucleotide sequence from the amino acid sequence of the polypeptide - Biology

This page looks at how the information coded in messenger RNA is used to build protein chains. It is designed for 16 - 18 year old chemistry students. If you are a biochemistry or biology student, you will probably find it a useful introduction, but will have to look elsewhere to find all the detail you need.

Note: If you have come straight to this page from a search engine, you should be aware that this is the fifth page in a sequence of pages about DNA and RNA. It will all make more sense if you start from the beginning of the sequence with the structure of DNA.

From messenger RNA to a protein chain

A quick overview of the process

You will remember that messenger RNA contains a sequence of bases which, read three at a time, code for the amino acids used to make protein chains. Each of the sets of three bases is known as a codon. The table below repeats one from the previous page:

You may also remember that three codons serve as หยุด codons, and one (AUG) codes for methionine, but also serves as a เริ่ม codon. We'll look in some detail at how this works further down the page.

Translating the code into an actual protein chain is complicated by the fact that individual amino acids won't interact with the messenger RNA chain. The amino acids have to be carried to the messenger RNA by another type of RNA known as transfer RNA - abbreviated to tRNA (as opposed to mRNA for messenger RNA).

All of this is controlled by a ไรโบโซม - a hugely complicated structure involving protein molecules and yet another form of RNA (ribosomal RNA or rRNA).

This is going to be quite complicated. We'll take it gently and simplify it where possible.

Finding the start point of the messenger RNA

You may find descriptions of this process which imply (although without actually saying so directly) that the messenger RNA starts with the codon AUG - the start codon - at the 5' end. That's not so!

There is a length of RNA upstream of the start codon which isn't actually used to build the protein chain. So how does the system know where to start? How does it find the right AUG codon from all the ones which are probably strung out along the RNA to code for the amino acid methionine?

Note: If you don't know what I mean by the 5' end or by upstream, it is probably because you haven't read these pages from the beginning. Taking short cuts is rarely a good idea!

Ribosomes come in two parts - a smaller bit and a larger bit. The smaller bit is involved in finding the start point.

It attaches to the 5' end of the messenger RNA and moves along it until it comes to a particular pattern of bases which it can bind to. This pattern occurs just before the first occurrence of the AUG codon in the messenger RNA strand.

The ribosome now has to build the protein chain starting with a methionine at the AUG codon it has just found.

Before we can talk about that we have to introduce transfer RNA . . .

Transfer RNA (tRNA) is responsible for carrying amino acids to the messenger RNA and then holding them there in a way that enables them to join together.

Transfer RNA is a short bit of RNA containing about 80 or so bases. These are mostly the same bases as in messenger RNA (A, U, G and C), but it also contains some modified bases which won't concern us at this level. A model of a typical transfer RNA looks like this:

Note: This diagram comes from Wikipedia. Most of the colour coding is irrelevant to this discussion - but note the little bit in grey at the bottom which is where the anti-codon is (see below).

This model is quite difficult to follow, and I am going to simplify it down to pick out the two important bits of it

At the 3' end of every transfer RNA molecule, the chain ends with the sequence of bases C C A. Remember that the bases in RNA and DNA are attached to a backbone of alternating phosphate and sugar groups. At the very end of the chain is the -OH group on the 3' carbon of a ribose ring.

The amino acid gets attached to this by forming an ester link between this -OH group and the -COOH group of the amino acid. This is no different from the formation of an ester between, say, ethanol and ethanoic acid - except that it is carried out under the influence of an enzyme rather than the more fierce conditions used in the lab.

Note: How the amino acid attaches to the tRNA is just for interest. It is unlikely to be needed for exam purposes at this level.

The other important bit is at the bottom of the molecule, shown in grey in the model. This is known as an anti-codon. As you will see shortly, the anti-codon attaches the transfer RNA with its amino acid to the right place on the messenger RNA molecule.

For chemistry purposes, all we are interested in is the attached amino acid, and the anti-codon, so we can simplify the whole thing down. Here is a very simplified diagram showing the transfer RNA for methionine with the methionine attached:

In the diagram, the anti-codon is for the amino acid methionine. The messenger RNA code for methionine is AUG. If you look at the code in the anti-codon for methionine, it is UAC. That is exactly complementary to AUG. The U in the anti-codon will pair with the A in the messenger RNA the A in the anti-codon pairs with the U in the mRNA and the C in the anti-codon pairs with the G in the mRNA.

How does a transfer RNA molecule pick up the right amino acid? This is all under control of enzymes which recognise the shapes of the various amino acid and tRNA molecules and make sure that they pair up properly.

Translation is the name given to the process of turning the coded message in the messenger RNA into the final protein chain.

We left the messenger RNA a little while back with part of a ribosome attached to it at the AUG start codon. The diagram shows this, together with a small part of the RNA base sequence downstream of the start codon needed to make an imaginary protein chain. The bases upstream of the start codon aren't relevant to us once the ribosome has found the place to start from.

None of these diagrams are drawn to scale!

Now two things happen. The transfer RNA carrying a methionine attaches itself to the AUG codon by pairing its anti-codon bases with the complementary bases on the messenger RNA. And the second, bigger part of the ribosome attaches to the system as well.

Now another transfer RNA molecule with its attached amino acid binds to the next codon along the chain. The next codon on the messenger RNA is GGU which codes for glycine (Gly). The anti-codon would therefore have to be CCA. Remember that A pairs with U, and G pairs with C.

Next, the ribosome moves along the messenger RNA chain to the next codon. At the same time a peptide bond is made between the two amino acids, and the first one (the methionine) breaks away from its transfer RNA.

That transfer RNA molecule leaves the ribosome and goes off to pick up another methionine.

Now the process repeats. The next codon is GUA which codes for valine (Val). The anti-codon must be CAU. (If you can't see this at once, stop and think about it. Don't go on until you are happy that you could work out the anti-codon for every codon, and vice versa.)

And again, the ribosome moves forward one codon, a new peptide bond is formed, and the transfer RNA on the left breaks away to be used again later.

And the next transfer RNA with its amino acid comes along . . .

Eventually, of course, this will come to an end. How?

Eventually, the ribosome will come to a stop codon. The three stop codons don't code for any amino acids, and so the process comes to a halt. The protein chain produced up to that point is then released from the ribosome, and then folds itself up into its secondary and tertiary structures.

The final page in this sequence looks very briefly at what happens when the code in DNA becomes changed in some way . . .

Questions to test your understanding

If this is the first set of questions you have done, please read the introductory page before you start. You will need to use the BACK BUTTON on your browser to come back here afterwards.


Genetic code

The genetic code is the set of rules by which information encoded in genetic material (DNA or RNA sequences) is translated into proteins (amino acid sequences) by living cells.

Specifically, the code defines a mapping between tri-nucleotide sequences called codons and amino acids every triplet of nucleotides in a nucleic acid sequence specifies a single amino acid.

Because the vast majority of genes are encoded with exactly the same code, this particular code is often referred to as the canonical or standard genetic code, or simply the genetic code, though in fact there are many variant codes thus, the canonical genetic code is not universal.

For example, in humans, protein synthesis in mitochondria relies on a genetic code that varies from the canonical code.

The genome of an organism is inscribed in DNA, or in some viruses RNA.

The portion of the genome that codes for a protein or an RNA is referred to as a gene.

Those genes that code for proteins are composed of tri-nucleotide units called codons, each coding for a single amino acid.

Each nucleotide sub-unit consists of a phosphate, deoxyribose sugar and one of the 4 nitrogenous nucleotide bases.

The purine bases adenine (A) and guanine (G) are larger and consist of two aromatic rings.

The pyrimidine bases cytosine (C) and thymine (T) are smaller and consist of only one aromatic ring.

In the double-helix configuration, two strands of DNA are joined to each other by hydrogen bonds in an arrangement known as base pairing.

These bonds almost always form between an adenine base on one strand and a thymine on the other strand and between a cytosine base on one strand and a guanine base on the other.

This means that the number of A and T residues will be the same in a given double helix as will the number of G and C residues.

In RNA, thymine (T) is replaced by uracil (U), and the deoxyribose is substituted by ribose.