Gene Moth_2080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2080
Symbol
ID	3831830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2170940
End bp	2172304
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	48%
IMG OID	637830007
Product	MATE efflux family protein
Protein accession	YP_430917
Protein GI	83590908
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.634791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACAGTCG AACGTTCTCA GGAACTCGAG TCTGGTCCTG TCGGGCGCCT ATTGTGGCAG 
TTTTCCTGGC CGGCTATTGT AGGAATGATG TGCAATGCTC TCTATAACAT TGTAGACCGG 
GCATTCGTGG GACGCGGGGT CGGTACTCTG GCAATCGCCG CTACCACCGT AGCCTTCCCC 
TTGATGATAA TACTACTGGC GTTGTCCCTT TTGATAGGGG TAGGAGCTAC TGCCTTGATT 
TCCATCCGGT TGGGGGAACA AAAAAAGGAA GAGGCGGAAG TGGTAGCAGC CAACGCTACC 
TCATTACTGG TATTATTACC TCTCTGTTTT TCGATTATCT ATCTGTTATT TCCAGAACCT 
ATTTTAAGAC TGTTCGGGGC CAGTTCCGAG GTTTTGCCTT ATGCCCGTGA TTTTATGCAT 
ATTATTATGC TGGGTTCGGT ATTTGGAGGC CTTAGCATGG GCATGAACAA TTTTATCCGA 
GCGGAAGGCA ATCCCGTGAT GGCCATGTCC ACCCAGGTAC TGGGTGCTCT AATCAACGGG 
GTTTTAAATT ATACATTCGT TTTTCAAGTA GGAATGGGGA TCAAAGGCTC GGCTCTGGCG 
ACCGTACTAG GTCAATTATT CTCTACGATA TGGGTGTTAA GCTATTATTT AACCGGCCGC 
AGCCTGATCA AATTAAAGTT AAGAAACTTT CGGCCACGGC TGCCAATTCT CTTAAGCATT 
GTTTCCATAG GCTTTGCCCC GTTTGCAATG GAACTAGCCA CTTGCCTGCA ACAGGTAATC 
TTGAATAAAT CCGTCTTGAC ATATGGCGGT GATTTAGGTT TGTCCGCGGT TGGAATACTT 
ATGAGCATTA TCACTTTATT GTTCATGCCC ATTCTGGGCA TCAGCCAGGG TGCGCAACCA 
CTTATCGGGT TTAATTATGG CGCCCGCCGG TTTGACCGGG TTAAGGCAAC CTTAAAAAAG 
GCGATATTTG CCGGTAGCTG CGTTTCCGTA ACAGGTTATC TGGTTATGCG TATCTGGCCA 
GTCGAGATCG CAGGAATATT CACCAAAGGC GACATCGCTC TTACCAGAAT GACTGCCGAC 
GCGATGCTCG TGTTTTTCTG CATGATCTTT ATGCTCGGTT TTCAAATCGT ATGTTCGCAA 
TATTTCCAGG CCGTGGGCAA AGCGGTACAG GCGGCAATAC TCAGCCTGTC GCGGCAGGTT 
CTGTTTTTCA TCCCGTTGCT GCTTATCCTT CCTCACTTCT GGGGCATAAA CGGCGTTTGG 
CGAACGGCTC CCATTGCCGA TGGCCTTTCG GTCATAATTA CGGCCGTCTT CATTTTAAAT 
GAAATGAAAT CTCTAGCTAC AGAAGCTAAA GAAGCATCTC CCTAA

Protein sequence

MTVERSQELE SGPVGRLLWQ FSWPAIVGMM CNALYNIVDR AFVGRGVGTL AIAATTVAFP 
LMIILLALSL LIGVGATALI SIRLGEQKKE EAEVVAANAT SLLVLLPLCF SIIYLLFPEP 
ILRLFGASSE VLPYARDFMH IIMLGSVFGG LSMGMNNFIR AEGNPVMAMS TQVLGALING 
VLNYTFVFQV GMGIKGSALA TVLGQLFSTI WVLSYYLTGR SLIKLKLRNF RPRLPILLSI 
VSIGFAPFAM ELATCLQQVI LNKSVLTYGG DLGLSAVGIL MSIITLLFMP ILGISQGAQP 
LIGFNYGARR FDRVKATLKK AIFAGSCVSV TGYLVMRIWP VEIAGIFTKG DIALTRMTAD 
AMLVFFCMIF MLGFQIVCSQ YFQAVGKAVQ AAILSLSRQV LFFIPLLLIL PHFWGINGVW 
RTAPIADGLS VIITAVFILN EMKSLATEAK EASP