Gene Moth_2324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2324
Symbol
ID	3831076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2445061
End bp	2446665
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	60%
IMG OID	637830248
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_431154
Protein GI	83591145
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.937948
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGTTT TGGCCGATCA TGAAAGGGAA CAATCGGGGG CAGGAGCAGG CCTGCCGGCA 
GCCGACGGCG AGGTACAGGG CTCCTGGATT ATCCCCGTCC TGGTGGCCCT CATCGGGGCT 
TTTATGTCCA TCCTGGACTC CAGCATCGTC AATGTGGCCA TCCCGACCAT CATGCATGTT 
TTTAATACCG ATACCAGCAC GGTCGAGTGG GTGGTCACCA TTTACATGCT AGCGCTGGGG 
GTTATTGTCC CCTTAAGCGG CTGGCTGGGT GACAAGCTGG GCTTCAAAAA GTTATACGTC 
ATCGCTCTGG TTATATTTAC CTTCGGGTCA CTCCTGTGCA CCTTGAGCTG GAACGTCGAT 
TCCCTCATCG CGGCCCGGGT GGTCCAGGCC CTGGGCGGCG GTTTGATCAT GCCCACTACC 
ATGGCCATGA TTTATCGTAT GGTACCGCGG GAAAGAATTG GCAGCGCCAT GGGAGTGCTG 
GGGATTGCCC TCTTTGTGGC GCCGGCCATC GGGCCGACCC TGGGCGGCTA CCTGGTGGAG 
TATGTTGACT GGCGCTGGAT TTTTACCATT AATCTGCCCA TCGGGGTGCT GGGGGTGCTG 
CTTTCCCTGG TCCTCCTGCC AGATTTCCCG GCTGCCGAAG CGGGCAGGCT GGATATCGGG 
GGGGCCGTAA CGGCGGCGGT AGGCCTTTTT ACCCTCCTCC TGGCCCTGAG CAAGGGCGCG 
GACTGGGGCT GGACCTCAGA AGCCACCGTC TTCCTGTTTT ACACCAGCGC GGTTTCCCTC 
GGCCTCTTTA TTTACCTGGA ACTTACCTGT GCCAACCCCC TCCTGGAGCT GAGGGTATTC 
CGCTATCCGG CCTTTACCCT GGCCAATCTC ATGGTGGTGG TAACCACCAT TGGCCTTTTT 
GGCGGCATTT TCTACGTCCC CCTTTTTCTC CAGACCGTCC GCGGCCTGGG AGCTATGGAA 
ACGGGTCTGC TGTCCATGCC CGGCGCCCTG GCCTCGGCGC TGATGATGCC GGTAACCGGC 
CGCCTCTACG ACCGCATCGG CCCCCGCCTG ATGGCGGTGA CCGGGCTGGT AGTGCTGGCG 
ATAACAACCT ATCTCTTTCA CTTCTTAGAT ATCGTTACCC CCGACAGGGT CATCATTACC 
TGGCTGATCC TGCGGAGCGT TAGCATGTCT TTTGCCTCCA TGCCGGCCCA GACGGCGGCC 
CTGGCGGGGC TGCCGCCAGA ACTGGTAGGC CGGGCTTCGG CCATGACCAA TATTATCAAC 
CGGGTGTCGG GTTCTTTCGG GATAGCCATC TTGACCTCGA TTTTAAATCA CCGTACGGCC 
CTGCACGCTA CGCAGCTAGC AAGCCAGATC ACAGCGGACA ACCCGGCCGT TACGGCCTTT 
TTCCAGCAGG TGGCTCTCTA CCTGGGGAGC GGGTCGGCAG CGACCCAGGT GAAGAGCCTG 
GGTACCACTT ATCTGGCAGG ACTGGTGTCC CAGGCGGCTT TTATACGAGG TATTGACGAC 
ATTTTTGTCG TGATGACCGG TTTTGCCCTG GCCGGCGTCC TCCCGGCCTT TTTCCTCCAA 
AAAGGGCCTG GCGGCGCCCG GCCGGGCTTT GGCGGCGGCG AGTAA

Protein sequence

MKVLADHERE QSGAGAGLPA ADGEVQGSWI IPVLVALIGA FMSILDSSIV NVAIPTIMHV 
FNTDTSTVEW VVTIYMLALG VIVPLSGWLG DKLGFKKLYV IALVIFTFGS LLCTLSWNVD 
SLIAARVVQA LGGGLIMPTT MAMIYRMVPR ERIGSAMGVL GIALFVAPAI GPTLGGYLVE 
YVDWRWIFTI NLPIGVLGVL LSLVLLPDFP AAEAGRLDIG GAVTAAVGLF TLLLALSKGA 
DWGWTSEATV FLFYTSAVSL GLFIYLELTC ANPLLELRVF RYPAFTLANL MVVVTTIGLF 
GGIFYVPLFL QTVRGLGAME TGLLSMPGAL ASALMMPVTG RLYDRIGPRL MAVTGLVVLA 
ITTYLFHFLD IVTPDRVIIT WLILRSVSMS FASMPAQTAA LAGLPPELVG RASAMTNIIN 
RVSGSFGIAI LTSILNHRTA LHATQLASQI TADNPAVTAF FQQVALYLGS GSAATQVKSL 
GTTYLAGLVS QAAFIRGIDD IFVVMTGFAL AGVLPAFFLQ KGPGGARPGF GGGE