Gene Moth_0134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0134
Symbol
ID	3830791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	128807
End bp	130141
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	62%
IMG OID	637828068
Product	primary replicative DNA helicase
Protein accession	YP_429016
Protein GI	83589007
COG category	[L] Replication, recombination and repair
COG ID	[COG0305] Replicative DNA helicase
TIGRFAM ID	[TIGR00665] replicative DNA helicase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.132489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.322197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCAG AAATAGAGAG GGTACCGCCC CAGAGTATAG AGGCCGAGCA ATCGGTTCTG 
GGGGCTATCA TGCTGGACCG GGAAGCCCTC TACGCTGTCC TGGAAACCCT GAAGGTAGAC 
GATTTTTACC GGGAAGCCCA CCGCATGATC TATCGGGCCA TCCTGGACCT GAATGAGCGG 
GGCGAGGCCG TCGACCTGCT GACGGTGACG GAAGAACTCC GTCGCCGGGG TGAACTGGAG 
GCAGCCGGCG GTGTCGCCTA CCTCACTTCC CTGACCGGGG ATGTCCCCAG CGTCGCCAAT 
GCCGGATATT ATGCCCGCCT GGTGGCTGAG AAGGCTGCCC TGCGCTCCCT CGTCCAGGCA 
GCTTCCCAGA TCACCGAGAT GGCCTTCAGC GAGAGCGGCA GCGTCGACCA GATTCTCGAC 
GAGGCCGAAC GTCTGATCTT TGAAGTAGCC GGGGGGCGGC ACCGGAGCGG TTTCGTTCCC 
ATTAAAAACG TCCTTCTCCA GACCTTCGAA CAGCTGGAGC GCCTGAGCAC CCACAAGGGC 
GAGGTCACCG GAGTGCCAAC CTTTCACGAT CTGGACCGTC TCCTTTCCGG TCTCCAGCCC 
TCCGACCTGA TTATCTGCGC CGCCCGGCCG GGGATGGGCA AGACCTCCTT TTGCCTGAAC 
ATTGCCCAGC AGGTGGCTGT CAAGGAAAAA CTACCGGTAG CCATTTTCAG CCTGGAGATG 
TCCCGGGAGC AGCTGGTACA GCGGATGCTG GCCGCCGAAG CCATGGTCGA ACAGCAACGC 
CTGCGGACTG GCTATTTGAC GGAAGACGAC TGGGCCCGGC TTGTCAACGC CGCCGGCATT 
CTGGGTGAAG CGCCCATTTA TATTGACGAT ACGCCGGCCA TTTCCGCCCT GGAGGTTCGG 
GCCAAGGCGC GACGACTGCA GTCGGAGACC GGTCTGGGCC TGGTGGTAGT CGACTACCTG 
CAGCTGATGC AGGCCCATCG CCGGGTGGAC AGTCGCCAGC AGGAGATCGC CCTCATCTCC 
CGGGCCATGA AGGCCCTGGC CCGGGAATTG AACGTCCCGG TCATGGTCCT CTCCCAGTTG 
AACCGGGGTG TCGAGCAGCG CCAGGATAAA CGCCCGGTCA TGGCCGACCT CCTGGAAAGC 
GGCGCCATCG AGGCCGACGC CGATGTCATT ATCTTCCTTT ACCGGCCCCA ATACTACGAT 
CCCGACACCG ATAAAAAGGG CATCGCCGAA GTCATCGTGG CCAAGCACCG CAACGGTCCC 
GTGGGAACGG TGGAAATGGC CTTTCTACCC GAGTATACCA AGTTTGTCGA CCTGGCCCCC 
GAACCGGCCG GGTAA

Protein sequence

MAAEIERVPP QSIEAEQSVL GAIMLDREAL YAVLETLKVD DFYREAHRMI YRAILDLNER 
GEAVDLLTVT EELRRRGELE AAGGVAYLTS LTGDVPSVAN AGYYARLVAE KAALRSLVQA 
ASQITEMAFS ESGSVDQILD EAERLIFEVA GGRHRSGFVP IKNVLLQTFE QLERLSTHKG 
EVTGVPTFHD LDRLLSGLQP SDLIICAARP GMGKTSFCLN IAQQVAVKEK LPVAIFSLEM 
SREQLVQRML AAEAMVEQQR LRTGYLTEDD WARLVNAAGI LGEAPIYIDD TPAISALEVR 
AKARRLQSET GLGLVVVDYL QLMQAHRRVD SRQQEIALIS RAMKALAREL NVPVMVLSQL 
NRGVEQRQDK RPVMADLLES GAIEADADVI IFLYRPQYYD PDTDKKGIAE VIVAKHRNGP 
VGTVEMAFLP EYTKFVDLAP EPAG