Gene Moth_0230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0230
Symbol
ID	3832558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	228873
End bp	229865
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	61%
IMG OID	637828166
Product	peptide chain release factor 2
Protein accession	YP_429108
Protein GI	83589099
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1186] Protein chain release factor B
TIGRFAM ID	[TIGR00020] peptide chain release factor 2

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.413245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCCC CGGGTTTCTG GGAAGACCGC GCCCGGGCCG AGGCCGTAGG CAAGCGCCTC 
ACCTACCTCA AGGAGAAGCT GGCCCGCTAC CGGGAGTTAG AGAGCAAGTG CGCCGACGTC 
CGGGAGCTAT GGCAACTGGC CCTGGCCGAA GACGACCACT CCCTGGAAGA AGAAATAGCC 
AGGGACCTGG CTGCTGTCGA AGGCAAAGTG GAGGGTCAGC TCCTGGCGAC CCTGCTGAAC 
GGCCCCTATG ACCGCCATAA CGCCATCCTC TCCCTCCATC CAGGCGCCGG GGGAACGGAG 
TCCCAGGATT GGGCCGCCAT GCTGTTACGC ATGTATAATC GCTGGTGCGA AGACCGCGGC 
TACCAGGTGG AACTCCTGGA TTACCTGGAG GGTGAAGAAG CCGGACTAAA GAGCGCCACC 
ATCCTCGTCA AAGGGGAGAA CGCCTACGGC TACCTCCAGG CGGAGAAGGG GGTGCACCGT 
CTGGTCCGGA TCTCGCCCTT TGACGCCGCC GGTCGCCGCC ATACCTCCTT TGCCTCGGTG 
GATGTTATCC CGGAAGTGGA GGCCGACGAG GAAGTCGAAA TTAATCCCGA CGATTTAAAG 
ATCGACACCT TCCGCTCCCA GGGAGCCGGG GGACAGCACG TTAACAAGAC GGACTCGGCG 
GTGCGGATCA CCCACCTGCC CACGGGGATA GTGGTAACCT GCCAGAACGA GCGCTCCCAG 
CACGCCAACC GTTTGAGCGC CATGAAGATC CTCCAGGCCA GGCTGGCGGC TCTAAAGCGC 
CAGGAACAGG AGGCGGAGCT GGCCCAGATC CGGGGTGAAC AGCGGGAGAT CGCCTGGGGG 
AGCCAGATCC GTTCCTATGT CTTTCATCCC TACAGCCTGG TTAAAGATCA CCGCACCGGG 
GTGGAAACAG GTAATATCCA GGCCGTTATG GACGGCCAGA TCGACCCCTT TATCCAGGCT 
TATTTACACT GGCAGCGTAG AAAGCAAGGC TAA

Protein sequence

MLAPGFWEDR ARAEAVGKRL TYLKEKLARY RELESKCADV RELWQLALAE DDHSLEEEIA 
RDLAAVEGKV EGQLLATLLN GPYDRHNAIL SLHPGAGGTE SQDWAAMLLR MYNRWCEDRG 
YQVELLDYLE GEEAGLKSAT ILVKGENAYG YLQAEKGVHR LVRISPFDAA GRRHTSFASV 
DVIPEVEADE EVEINPDDLK IDTFRSQGAG GQHVNKTDSA VRITHLPTGI VVTCQNERSQ 
HANRLSAMKI LQARLAALKR QEQEAELAQI RGEQREIAWG SQIRSYVFHP YSLVKDHRTG 
VETGNIQAVM DGQIDPFIQA YLHWQRRKQG