Gene Cthe_0299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0299
Symbol
ID	4808517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	374726
End bp	376096
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	43%
IMG OID	640105710
Product	MATE efflux family protein
Protein accession	YP_001036730
Protein GI	125972820
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000180901
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAG AAACGGCGTC AATAAAAAAG ATGAGTGTCT TTGCTCTCAC ATGGCCGATA 
TTTATTGAAA CGCTGCTGAG AACAATGCTG GGAAATGTGG ATACTTTTAT GTTGAGTACA 
TATTCCGACG ATGCCGTGGG GGCAGTAGGG GTTGTAAGTC AAATAAGTTA TATACTTATC 
ATGCTGTACA ACGTTGTTTC GTCAGGAACA CTGGTGCTTA TATCCCAGTA TCTGGGCGCA 
AAAAAGAAAA AGGAAGCTTC AGTGGTGGCT GTCACTTCAA TTGCAGGCAG TTTGATATTT 
GGTTTGTTTG TCGGATTGGC TGTATTTCTG TTCAGAAGCC AGATATTAAC ATTTCTTAAT 
TTGCCGCCCG AACTTATGGG ATATGCTATG ACATTTTTGG GAATTGTCGG AGGATTTTCT 
TTTACCCAGG CATTGATAGC CACTTTGTCT GCAATAATCA GAAGCTATGG CAACACCAGG 
ATAACCATGT ACATTTCTGT CGGCATGAAT ATCCTTAATA TTATTGGAAA CAGTATTTTC 
CTGTATGGAC TGCTGGGGGC GCCGAAAATG GGAGTGACCG GTGTTGCCAT TGCAACTGTA 
ATAAGCCAGG CTGTCGGTGT TGTTGCTATG CTGATTGTAA TGCTGACAGG ACTTAATCAA 
AAATTTTCTT TCCGGGACCT TGTGCCGCTG CCGTGGGAGA TTTTAAGGGA TATATTGAAA 
ATCGGACTTC CTTCTGCGGG TGAAGGAATT GCTTACGAAG CATCTCAGCT TACCATTACC 
CGTATTATAA CGGTATTGGG AAAGGTTGCC CTTACAACCA GGGTATACAC TTTAAACATT 
ATGTATTTTG TAATGGTTTT TTCAGTAGCG GTTGGTCAGG GAACTCAAAT TGTTGTAGGC 
CATCTTGTGG GGGCGGGCGA TAATGAAAAA GCATACAAAA CATGTATTAA AAGTCTGAGA 
TATGCTGTTG TGGTGGCAAT CATTCTTGCG GGAATTGTTT CGTTCTTTTC GGAGCAGCTT 
CTTGGAATCT TTACGGATGA CCGGGCTATA ATTGAAATGG GGAGCAAACT CTTGCTGATT 
GCAGTTATTT TGGAGCCGGG AAGAGTTTTC AATATTGTTA TAATAAACTC TCTGAGAGCG 
GCGGGTGATG CCAGATTTCC CGTTATTATG GGTATTATAT CCATGTGGGG AATAGGAGTG 
TTGCTGTCAT ATTTCCTGGG TGTGGCCTGC GGCTTGGGAT TGATAGGTGT ATGGATAGCC 
TTTGCCAGTG ATGAATGGTT CAGAGGGATT GCCATGCTTC TGCGCTGGAG ATCCCGCGTC 
TGGTATAAAA TGGCACTTGT AAAAAATCAG AATATTGAAA TGCCGGCTTA G

Protein sequence

MQKETASIKK MSVFALTWPI FIETLLRTML GNVDTFMLST YSDDAVGAVG VVSQISYILI 
MLYNVVSSGT LVLISQYLGA KKKKEASVVA VTSIAGSLIF GLFVGLAVFL FRSQILTFLN 
LPPELMGYAM TFLGIVGGFS FTQALIATLS AIIRSYGNTR ITMYISVGMN ILNIIGNSIF 
LYGLLGAPKM GVTGVAIATV ISQAVGVVAM LIVMLTGLNQ KFSFRDLVPL PWEILRDILK 
IGLPSAGEGI AYEASQLTIT RIITVLGKVA LTTRVYTLNI MYFVMVFSVA VGQGTQIVVG 
HLVGAGDNEK AYKTCIKSLR YAVVVAIILA GIVSFFSEQL LGIFTDDRAI IEMGSKLLLI 
AVILEPGRVF NIVIINSLRA AGDARFPVIM GIISMWGIGV LLSYFLGVAC GLGLIGVWIA 
FASDEWFRGI AMLLRWRSRV WYKMALVKNQ NIEMPA