Gene Moth_0623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0623
Symbol
ID	3832598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	646476
End bp	648293
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	62%
IMG OID	637828564
Product	DNA primase
Protein accession	YP_429496
Protein GI	83589487
COG category	[L] Replication, recombination and repair
COG ID	[COG0358] DNA primase (bacterial type)
TIGRFAM ID	[TIGR01391] DNA primase, catalytic core

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0721035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACCG CCTTCAACCA GGATGTGATT CATGAGGTTA AAGACCGGAT AGATATAGTG 
GAAATTATTG GTGGCTACGT TCAGCTCAAG AAACGGGGCC GTTCCTATGT CGGCCTGTGC 
CCCTTTCATA ACGAAAAAAC ACCGTCCTTT ACCGTCAGTC CCGACAAGCA GGTATTCTAT 
TGCTTCGGCT GCGGCGCCGG CGGTGATGTC CTGACTTTCC TCATGAAGCG GGAAGGCCTC 
AGTTTTCCCG AAGCCCTGGC CGCCCTGGCT GCCAGGGCCG GCGTCGAGCT GGTAGGGGAA 
GAAGAAACCC CGGCGGCCCG GCGGCAGCGG GAGCTAAAAG AGCGCTTGTA CCGGCTGGGG 
GCAATAGCTG CCAGCTTTTA TTATCGCATC CTGGCCCGGC ACCCGGCCGG GGCTCCGGCC 
CGGAGTTACC TCCAGAGGAG GGGAATCAAG GGCGTTACGG CACGCCAGTT CGAACTCGGT 
TTCGCCCCCG ATGCCGGTGC CGTCCTGGTC AACTACCTGC AGCGCCAGGG CTTTACGCCG 
GAAGAGATCG AACAGGCGGG TTTGAGCCTC AGCCGGCCGC CCCGGGGCCT GGTCGACCGT 
TTCCGGGGGA GGTTGATGTT TCCTATCAAA GACAGCCGCA GCCGGGTCAT CGGTTTCGGT 
GGCCGCGTCC TGGGGGAAGG CCAGCCAAAG TATTTAAATT CCCCCGAGAC CATATTATTT 
CATAAAGGCC ACCACCTCTT CGGCCTGCAC CTCTCCCTGC CCGGCATTCG CAAAGAGGGC 
CGGGCCATTC TGGTAGAAGG TTATATGGAT ATGATTGCCG CCTGGCAACA CGGGATTGAC 
AACGTCGTAG CCTCCCTGGG CACGTCCCTG ACTCCAGCCC AGGCCCGGGA ATTAAAAAAA 
TACGCCCGGG AGGTAATCAT CGCCTACGAC GCCGACACCG CCGGCCAGGC AGCCACCCTG 
CGGGGACTGG ATATCCTCGC GGCTGCCGGC CTCCAGGTCC GGGTGCTGCA ATTGCCCGAA 
GGTAAAGACC CGGACGAGTT CCTGGCCGCC CGCGGGCCGG AGGCCTTCCG GGAACTGGTC 
GCCGGGAGCC AGGGCCTCAT GGAGTTCCGG ATTCATAAAG CCGTCAGCGA GCATGATGCC 
GGCACCGCCG CGGGCCGGAA GGCCATCATG ACCGCCCTCC TCCCTTACCT TCGCCAGGTG 
AGGGACGCTG TAGAACAGGA GACCTACGCC CGCCTCCTCA ACCGTTATAC AGGGATATCG 
GAAACGGCTA TTTTAAACGA CATTCGCCGT CCGGAGGCCC GGCTGGATAG GGCAGTAAAA 
ACCACGTATA TCAGGGACGG CCGGGCTGGA GGGACTGCGG CCCCCCACCA GGCAGAACTA 
TTCTTATTGC GGGCCTACCT GGCCAGCCCC GCCCTGGCAA CCAGGATTGA CGCCGAACTC 
GGGGAAAACT GGTGCCGGGA CCAGGCCGCC AGGGACCTGG TGGCCGCCGT CAGGGAGCGA 
CGCCGGGAGA ATCCGGAACT TACCGGCCCG GATCTGGCCG GTATCCTGAC CCCGGGGAGG 
GAACCGCAAC AGGAAGCCCT GCTGGCCCGG TTGACCCTGG CCGAAGATCT GGGGCCGGTG 
GAAGAGCGGG CGGTAAACAA GGCCATCCGC CTGCTGAAGC TCCAGCAGTT GCGCCGGCAA 
AGCAAGTCTT TATGGCTCGC CCTGGCCCGG GCGGAAGACA CAGGTGACCA GGAACAAGTC 
CGGGAACTCC AGGGAAAGAT CTTTCACCTC CAGCAAACCA TCAACTCGTT AAAACTAGGA 
AGGGGGGAGT TACGGTGA

Protein sequence

MTTAFNQDVI HEVKDRIDIV EIIGGYVQLK KRGRSYVGLC PFHNEKTPSF TVSPDKQVFY 
CFGCGAGGDV LTFLMKREGL SFPEALAALA ARAGVELVGE EETPAARRQR ELKERLYRLG 
AIAASFYYRI LARHPAGAPA RSYLQRRGIK GVTARQFELG FAPDAGAVLV NYLQRQGFTP 
EEIEQAGLSL SRPPRGLVDR FRGRLMFPIK DSRSRVIGFG GRVLGEGQPK YLNSPETILF 
HKGHHLFGLH LSLPGIRKEG RAILVEGYMD MIAAWQHGID NVVASLGTSL TPAQARELKK 
YAREVIIAYD ADTAGQAATL RGLDILAAAG LQVRVLQLPE GKDPDEFLAA RGPEAFRELV 
AGSQGLMEFR IHKAVSEHDA GTAAGRKAIM TALLPYLRQV RDAVEQETYA RLLNRYTGIS 
ETAILNDIRR PEARLDRAVK TTYIRDGRAG GTAAPHQAEL FLLRAYLASP ALATRIDAEL 
GENWCRDQAA RDLVAAVRER RRENPELTGP DLAGILTPGR EPQQEALLAR LTLAEDLGPV 
EERAVNKAIR LLKLQQLRRQ SKSLWLALAR AEDTGDQEQV RELQGKIFHL QQTINSLKLG 
RGELR