Gene Moth_2397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2397
Symbol	prfA
ID	3830764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2517644
End bp	2518714
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	61%
IMG OID	637830316
Product	peptide chain release factor 1
Protein accession	YP_431222
Protein GI	83591213
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.456174
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGAAA AACTGGAACA GATCGAAGCC AGATACGAAG AACTGGGCCG GCTGATGGGT 
GACCCGGAAG TAATAGCCGA CCCCGAGCAA TTACAGAAAC ACGCCCGGGC CCACGCAGCC 
CTGGAAGATA TAGTCACCAC CTTCCGCCGG TACCGCCAGG TCAGCAATGA GCTGGCAGAA 
GATAAAGCCA TGCTGGAGGA AGAAAAAGAC CGGGAATTCC AGGAACTCCT CAAGGCCGAG 
ATTGAACGCC TGACCGGGGA GCAGGAACGC CTGGAACAGG AGTTGAAGAT CCTCCTCCTG 
CCCAAAGACC CCAATGATGA AAAGGACATC ATCATGGAGA TCCGCGCCGG TGCCGGGGGC 
GAAGAGGCGG CCCTCTTTGC CGGCGATCTC TTCCGCATGT ACCAGCGCTA TGCCGAAAAG 
AAACGCTGGC GGACGGAGAT TATCAGCTCC CACCCCACCG AACTGGGCGG TTTCAAGGAG 
ATCATCTTCC AGGTCGAGGG GCAGGGGGTT TACAGCCGCC TGAAGTTTGA GAGCGGGGTA 
CACCGGGTGC AGCGCATCCC GACCACGGAA TCCGGCGGGC GCATTCACAC GTCAACGGCT 
ACCGTGGCCG TGTTGCCCGA GGCGGAAGAG GTAGACGTGG AGATCAAGCC CGAAGACCTG 
CGGGTGGACA TCTTCTGTTC CAGCGGTCCC GGCGGCCAGT CGGTCAACAC CACCTACTCC 
GCCGTCCGCA TTACCCACCT GCCGACGGGC CTGGTGGTCT CCTGCCAGGA CGAGAAGTCT 
CAGTTAAAGA ATAAAGAAAA GGCCATGAGG GTGTTGCGCG CCCGGCTCCT GGATATGGCC 
CGGGCTGAGC GGGAAGGGGA GCTGGCTGAA GAGCGGCGCT CCCAGGTAGG CAGCGGCGAC 
CGCAGCGAGC GGATACGCAC CTATAACTTC CCCCAGAACC GGGTGACGGA CCACCGTATC 
GGCCTGACCC TCCACCACCT GGACCAGGTC CTGGCAGGAG AACTGGACGA GATTATCGAC 
GCCCTGGTCA CCACCGACCA GGCAGAACGC CTGAAAAACA TGGAGGCCTG A

Protein sequence

MLEKLEQIEA RYEELGRLMG DPEVIADPEQ LQKHARAHAA LEDIVTTFRR YRQVSNELAE 
DKAMLEEEKD REFQELLKAE IERLTGEQER LEQELKILLL PKDPNDEKDI IMEIRAGAGG 
EEAALFAGDL FRMYQRYAEK KRWRTEIISS HPTELGGFKE IIFQVEGQGV YSRLKFESGV 
HRVQRIPTTE SGGRIHTSTA TVAVLPEAEE VDVEIKPEDL RVDIFCSSGP GGQSVNTTYS 
AVRITHLPTG LVVSCQDEKS QLKNKEKAMR VLRARLLDMA RAEREGELAE ERRSQVGSGD 
RSERIRTYNF PQNRVTDHRI GLTLHHLDQV LAGELDEIID ALVTTDQAER LKNMEA