Gene Moth_0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0224
Symbol
ID	3832552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	221141
End bp	222502
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	66%
IMG OID	637828160
Product	DEAD/DEAH box helicase-like
Protein accession	YP_429102
Protein GI	83589093
COG category	[L] Replication, recombination and repair
COG ID	[COG4098] Superfamily II DNA/RNA helicase required for DNA uptake (late competence protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0854119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACACCC CCCTGGAGGA CCTCTGTCAC TGGCTTTATT TGGAAGGTGA AATAAAGCTT 
CTGCCCGGGG TGGGTTATGA CCCTGACGGT CGCCCCCGGT GCCGGCGCTG CGGCCAGGCT 
ACCGGGCTTT TAAAGGTCAA CTGCGCCGCC TGCAGCCGGG AGGATTGCCT GCTCTGCGAG 
GAGTGCCTGG CTATGGGCCA GTCCCGCCGC TGCCGTCCTC TGTACGCCAG GCCCTGGCCC 
TTTGCCGCGG GTTCTCCGGC CAGGCCGGCG GCAGTGGTGC GCCCCCTGCT CCGGTTTGAC 
CTCACGCCGG CCCAGGCGGA CGCCTACCGG GAGGCGGAAG GGTTTGCCAG CCAGGATAAG 
GAAAAGGAGT GCCTCCTCTG GGCCGCCTGT GGCGCCGGAA AAACTGAGGT GGCCTATGGC 
GCCATTGCTG CCGCCCTGGC CCGCGGGCGT AAAGTCCTTT ATGCCTGCCC CCGGAAGGAG 
GTTATCCGGG AACTCCACCC GCGCCTGCAA GCCGTCTGGC CGGGCCTGCG GATCCAGGCT 
CTATATGGTG GCAGCCAGGG CAAATACGGC GAGGCCGACC TCATCCTGGC CACCACCCAC 
CAGGCCTTAC GTTTCTACCG CCGTTTTGAC CTGGTGATCC TCGATGAAGT GGACGCCTTC 
CCCCTGGCGG GGGACCCCAT GCTCTACTAT GCCGTCGAGC GGGCGCGCCG GGAACATGGT 
CAGATCCTGT GGTTAACGGC CACCCCGCCC CCGGAGATGG TGGCCAGGGT CAGGAAGGGC 
AAGCTGGCCG TTATTTACTT GCCAGCCCGG TACCACGGCC ACCCCCTCCC GGAACCCGAG 
TTCGTCCGGG AACCATTTCT TAGGCCGCCG GGGACAGGCC CCCTGCCTCG CTCCATGGTT 
AACTGTATAA ATACTACCCT GGGGGCGGGG CTCCAGCTCC TGCTCTTCGT CCCGGCCGTT 
TCCCTGGTGG AGGGGGTGGC TGCATGGTTG CTGGACTCCT GGCCCGGCCA GGCCCCCGGC 
GGGGCCTGGG TCCGGGGCTG TCATGCCGCC CACCCCAGGC GGGAGGAAGT TATCGCTGCC 
TTTCGCCGGG GAGAATTCCC GGTTCTGGTG ACCACTACCG TTATGGAGCG GGGGGTTACC 
ATTCCCCGCC TGAACGTCCT TGTCCTTTAC GCTGAGGAGG GCAGGGTCTT TACGGCCAGC 
ACCCTGGTGC AGATCGCCGG CCGGGCCGGG CGTTCGGCGG CTTATCCCAC CGGGAGGGTA 
TGGTTTATAG GCCGGCACTT GAGCCCCGCC ATTGCAGAGG CTGCCCGCCA GATCCGGGAA 
TTCAACCGCC TGGCCCGCCG GCGGGGTTAC TTGACGCGGT AA

Protein sequence

MHTPLEDLCH WLYLEGEIKL LPGVGYDPDG RPRCRRCGQA TGLLKVNCAA CSREDCLLCE 
ECLAMGQSRR CRPLYARPWP FAAGSPARPA AVVRPLLRFD LTPAQADAYR EAEGFASQDK 
EKECLLWAAC GAGKTEVAYG AIAAALARGR KVLYACPRKE VIRELHPRLQ AVWPGLRIQA 
LYGGSQGKYG EADLILATTH QALRFYRRFD LVILDEVDAF PLAGDPMLYY AVERARREHG 
QILWLTATPP PEMVARVRKG KLAVIYLPAR YHGHPLPEPE FVREPFLRPP GTGPLPRSMV 
NCINTTLGAG LQLLLFVPAV SLVEGVAAWL LDSWPGQAPG GAWVRGCHAA HPRREEVIAA 
FRRGEFPVLV TTTVMERGVT IPRLNVLVLY AEEGRVFTAS TLVQIAGRAG RSAAYPTGRV 
WFIGRHLSPA IAEAARQIRE FNRLARRRGY LTR