Gene Moth_0640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0640
Symbol
ID	3832036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	667852
End bp	670770
Gene Length	2919 bp
Protein Length	972 aa
Translation table	11
GC content	57%
IMG OID	637828581
Product	helicase-like
Protein accession	YP_429511
Protein GI	83589502
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG0553] Superfamily II DNA/RNA helicases, SNF2 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.060382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCCCG GAATTCTGGT CCGCAGCACC ATTTATCCGG AAAAAGGGAT AGGCTTGGTC 
CTGGGGAATG AGGAGTTTTT CGACCAGGTC TACGTGCACG TTTTCTTTGA AAAGACCAGG 
GAGAGGCTCA CCCTGCCCCT GGCCGACTTA AGTCCGCTCC ATGATCCGCT GGCCAAAATG 
GAAGCAGGCA GCTTTTCCAC CGCTTCCCGC TTCCAGCTGC GCTGGCTGGT GGAGCAAATC 
CTGGCAGAAA ATTCCGGGGA GGGCCTTTTG GCCGCCGGGG GCTTCAAGAT TATCCCCCTG 
CCCCACCAGC TCCTGGCAGT AAGCTTCGTC CTCGACCAGT TCAAGCCGCG CGTCCTGATC 
GCCGACGAGG TCGGCCTGGG CAAGACCATT GAGGCTGCCC TGATCTACGA GGAACTGAAG 
GCCAGGGGTA TGGTAAAAAG GGTGCTGGTG GTAGCGCCGT CGGGGCTTTG CCTCCAGTGG 
CGGGAGGAAA TGAAAACCAA GTTCGGCGAA GACTTTATCA TCTACGATCG CAGCACCGTC 
CATTCTCTGA AACAGCTTCA CGGGGAGATG ACCAACGTCT GGACCTTGGC CGACCGGGTG 
ATTACTTCCC TGGACTTCAT CAAGCCCAAA AAGATTACCG CCGACCTGGA CGAGCGTGCA 
GCACGTGCCC GCCGCTGGCA CAACGAGCAG GTTTTTGCGG CCGCAGCCGC CGCCTGGTTC 
GACATGGTAA TCTTCGACGA AGCCCATAAA CTTACCAAAG ACATGACCGG CGAGGAAACG 
GCCCGCTATA AGGCAGGTCA TGCCCTGGTC CAAGCGGCGC CCATAGTGCT TCTCCTTACT 
GCCACCCCCC ACCAGGGGGA CCAGCACAAG TTCCGCAACC TGCTCCGGCT CATAGACCCT 
TATTTATTCT CCGGGGAAGG CCGGATTACG GCTGAAGACG TTAAAAAGGT AACGGTGCGC 
AACAATAAGC GGGCGGTGGT TGATTTCCAC GGGAACCGCC TTTTCAAGCA GCGGGTGGCC 
ACAGTGTGCC TGATCCACCG GGACGAGGTG GCGGACCAGG TGGAGCTGGA CCTCTACCGG 
GCGGTGACCG ATTATGTAAC TACTTTCTAC GAACTGGCCC GGCAGCAGAA CAATTTCACC 
ATGATGTTCC TGCTGCTCAT TTACCAGCGC ATGGTAAGCA GCAGCTCCCC CGCCATTCTG 
AAGTCCTTAT CCGCCCGTCT CGCGGCCCTG GAGGAGCTGC GCCGCCGTGC AGCCGACCAG 
GAGCCAGAGA GCGAGAGGGA AGAACCCGAC TGGGACGACC TGCAGGAACT GACGGCGGAG 
GAGCAGTTGG CCGAACTAAC GCGGGCCAGC GCTGCCCCGC GGGCCGGTAT CGTTATCGTA 
CCGGCCGCCT TGGCGGCCGA GATCGCGGCC CTGAAAAAAT GCTTGGCCCT AGCGGAGCGA 
GCCACAGCCG GCCGCAACGA TATCAAGTTC ACCAGGCTTC TGGAAATCAT TAATGAACTC 
AGAATCCAGG AAAACAATCC CCGCCTAAAA TTTATCATCT TTACCGAGTT TAGGGAGACG 
CAAGCTTACT TAGAGGAGCG CCTGACCAGC TTGGGCTACC GGACGGCGCT CATTAATGGT 
GCCATGTCCA CCACCGAGCG CATTGCCCAG GTGGAGCGCT TCCGCCGCGA GGCGGATTTC 
CTCATTTCTA CCGATGCTGG CGGCGAGGGC ATAAACCTGC AGTTCTGCCA TATCTTGATC 
AACTACGATC TGCCCTGGAA CCCCATGCGC TTGGAGCAGC GCATCGGCCG CATTGACCGC 
ATCGGCCAGG AACATGACGT TAAAGTGATC AATCTACAAC TGGCGGACAC GGTGGAGAAC 
CGGGTGCGGG AGGTAATCGA AAACAAGCTG GACACCATCC GCAGGGAGTT TTGCGCTGGC 
GAAGATAAGC TGGCTGACAT TCTAGGGGTC TTGCAAGATG AATTCGATTT TGAGAAGGTG 
TATATCGAGG CCTTGCTCAA GCAGGGCCGC AAGGCAGCCA ACCTGGATGC ATTATCCTGG 
CAGATTTTTG AACGAGCCCG GGAAATCGTT GAGGAAGAAA GATTAGCTCT GCCTATCTCC 
AATTTGGCCC CTGAATATGT TTTAGCGTCG CAGCGAGATT TGGAGAAGAG AGCCAAGAGG 
GTGCAAAGGC TGGTAGAGCA ATACCTGCAG GTTTACGGCG CCAGCCTGCA CCCGTACAAG 
CTGAGAGAGG GCGTTTACTA CTTTCAGGAC CCCAGGAGCG GCAGGCGCCT GCATAACGTG 
ATCTTCCAGC AGAAATATGC CCTGGCCAAT GAGGGGGCCG AGCTTTTGAG TTTCCAGCAC 
CCCTATATGG TGGAACTGTT AGCCCACCTG GAGGATGCCC TGCGGGAGGA TACGTCGGCA 
AAGCTTTTGG TACGTGAGAG AAAGTTCAGC GGGGAAAAAG GGTTTCTGTT TATATACCGG 
CTGACCCTCA CAAACTACTT GGACCCTACT GTTTACTATC TGGTACCTTG TTTTGTTAGC 
TTTGCTGGGG ATACGGGGCG GGTAAACGGC AGAATATCCC GCTATTTTCG CGATTGGGAG 
CAGCTCATCT GCACCGACCT GGTAACCGGA GAGATACCGT ATAATCTAAA GGAGGCCTGG 
CAACTGGCCC GGAAGGCTGT GCAGCAGGAA GCAGAGGTTC TCTTCTTTCA GGCAAAGGAA 
CGTTTGGAGA AGAGGCTGCG GGATGAAGAG GAAAAGTTTG AGAAATACTA CAAGGACCGG 
GAGGCGGCCA TCGAGAAGAT TGCCGTGGAC AATATCCGCG CAGCCAAGAA AAAAGAGCTG 
GAAGAGGACC GAAAGACTAG GCGGCAAGAA TGGTTGCGCC GCCGGCAGCT GGTGCCCAGC 
CTAAGCCTAG AGCAAGTTGC CTACGTGGAG TTTGCATGA

Protein sequence

MQPGILVRST IYPEKGIGLV LGNEEFFDQV YVHVFFEKTR ERLTLPLADL SPLHDPLAKM 
EAGSFSTASR FQLRWLVEQI LAENSGEGLL AAGGFKIIPL PHQLLAVSFV LDQFKPRVLI 
ADEVGLGKTI EAALIYEELK ARGMVKRVLV VAPSGLCLQW REEMKTKFGE DFIIYDRSTV 
HSLKQLHGEM TNVWTLADRV ITSLDFIKPK KITADLDERA ARARRWHNEQ VFAAAAAAWF 
DMVIFDEAHK LTKDMTGEET ARYKAGHALV QAAPIVLLLT ATPHQGDQHK FRNLLRLIDP 
YLFSGEGRIT AEDVKKVTVR NNKRAVVDFH GNRLFKQRVA TVCLIHRDEV ADQVELDLYR 
AVTDYVTTFY ELARQQNNFT MMFLLLIYQR MVSSSSPAIL KSLSARLAAL EELRRRAADQ 
EPESEREEPD WDDLQELTAE EQLAELTRAS AAPRAGIVIV PAALAAEIAA LKKCLALAER 
ATAGRNDIKF TRLLEIINEL RIQENNPRLK FIIFTEFRET QAYLEERLTS LGYRTALING 
AMSTTERIAQ VERFRREADF LISTDAGGEG INLQFCHILI NYDLPWNPMR LEQRIGRIDR 
IGQEHDVKVI NLQLADTVEN RVREVIENKL DTIRREFCAG EDKLADILGV LQDEFDFEKV 
YIEALLKQGR KAANLDALSW QIFERAREIV EEERLALPIS NLAPEYVLAS QRDLEKRAKR 
VQRLVEQYLQ VYGASLHPYK LREGVYYFQD PRSGRRLHNV IFQQKYALAN EGAELLSFQH 
PYMVELLAHL EDALREDTSA KLLVRERKFS GEKGFLFIYR LTLTNYLDPT VYYLVPCFVS 
FAGDTGRVNG RISRYFRDWE QLICTDLVTG EIPYNLKEAW QLARKAVQQE AEVLFFQAKE 
RLEKRLRDEE EKFEKYYKDR EAAIEKIAVD NIRAAKKKEL EEDRKTRRQE WLRRRQLVPS 
LSLEQVAYVE FA