Gene Moth_2370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2370
Symbol
ID	3832550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2495504
End bp	2496721
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	65%
IMG OID	637830289
Product	secretion protein HlyD
Protein accession	YP_431195
Protein GI	83591186
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000467489
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGGAAGA GGAGCTTTGC CGTTTTCACC CTGGCCTTTT TCCTCGCCGC CACGGCGGTA 
GGCGGCTGCG GTAAAAAGCC GGCCGATCAG GAGGCGGCAG CGGCAAAGGT GGCGGTGGAA 
GTGGCCAGAG TTACCCGGGG CAATATCGCC CAGCCCGCCC GGGTAACGGG GACGGTCCAG 
GCGGGGACAA CGGTTAACGT CACCGCCGCC ACGCCGGGCA AGCTGAAGTC CGTACTGGTA 
CACGTCGGCG ACAGGGTCAG CCGGGGCCAG ATCATCGCCG AGCTGGAGGA TGACGATGCC 
GCAGCCCGCC TGGCCCAGGC CCAGGCCGGC TTAGACCAGG CCCGCACCGC CCCGGCCCAG 
GCCGAGGCCG GGATCAAGCA GGCCGAAGCC AGGCTGAAGC AGGCCGAAGT CCAGGCTCAG 
CTAGATGAAG CCAATCTCCA GCGGACCCAG GCCCTTTTTG ACTCGGGAGC CGCCTCCCAG 
CAGCAACTGG ACGCCGCCCG GACGGCTGCC GCAGCCAGCA AGGAAAACCT GGAAATACTT 
CGCGGCGCCC TGGAGGCCGC CCGGGCCAGC CTGGCATCCT CCCAGGCCCA AATCGCCACG 
GCGGAGGCGG CCGTACGCCA GGCGCAAGTG GCCCTGGATA ATTGTTACAT AAAGGCTCCT 
GTTGACGGGG TAGTGGCCGC ACGCCTCCTG GAACCCGGGG AGACGGCCCA GGGAGCGGTG 
GTCACCCTGG TAACCACCGG CGACCTCCAG GTGGAGATCA ACGTAACCGA GGAGGACATC 
AATTACCTCC AGGTAGGAAA GAAGGTAAGC GTAGAAGTGC CGGCGGCGGG GAATAAAGCC 
CTGGAGGGCA GCGTCGCCAG CAGCAGCCCG GCTGCCGATA AGAGCACGCG CCTGTACAGC 
GTTAAGGTGG CTATTCCTGA CGCCCCGGCG GAAGTAAAAC CGGGTATGGC CGCCACGGTG 
GTCTTCCAGA CCCGGGAGGT GCAGAATGCC CTTCTGGTGC CGAAAAATGC CGTGGTCAAC 
CGCAGCGGCC AGAGCATCGT CTACACGGTC GTCGACGGCA AGGCCATGGG CCAGGTGGTT 
ACCACCGGCA TCGACGACGG CCGGAATATC GAGATCTTGA AGGGCCTGAA CGAAGGAACG 
ACCATTATCG TCAAGGGCCA GGACTTTGTC AATGAGAGCC AGCCGGTGCA AATAGTGAAT 
GGGGGGCCGC AAGCATGA

Protein sequence

MRKRSFAVFT LAFFLAATAV GGCGKKPADQ EAAAAKVAVE VARVTRGNIA QPARVTGTVQ 
AGTTVNVTAA TPGKLKSVLV HVGDRVSRGQ IIAELEDDDA AARLAQAQAG LDQARTAPAQ 
AEAGIKQAEA RLKQAEVQAQ LDEANLQRTQ ALFDSGAASQ QQLDAARTAA AASKENLEIL 
RGALEAARAS LASSQAQIAT AEAAVRQAQV ALDNCYIKAP VDGVVAARLL EPGETAQGAV 
VTLVTTGDLQ VEINVTEEDI NYLQVGKKVS VEVPAAGNKA LEGSVASSSP AADKSTRLYS 
VKVAIPDAPA EVKPGMAATV VFQTREVQNA LLVPKNAVVN RSGQSIVYTV VDGKAMGQVV 
TTGIDDGRNI EILKGLNEGT TIIVKGQDFV NESQPVQIVN GGPQA