Gene Cthe_1448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1448
Symbol
ID	4810598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1768194
End bp	1769606
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	40%
IMG OID	640106870
Product	MATE efflux family protein
Protein accession	YP_001037871
Protein GI	125973961
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGACA TATCTGCAAA TACAAGTTCA AGTGGCAATC CACTCGGTTA TGCACCTGTA 
CTTGGATTAA TTGGCAAGTT TGCCATTCCG TCTATTATCA GCATGCTGGT TGCAGCAGCC 
TATAATATTA CAGATCAGAT TTTCATCGGT CGTTTGGTTG GTATGCTTGG CAATGGAGCT 
ACCAGTGTAG CCTTTCCTGT TGTAACCTTT ACAACGGCTT TTGCCCAGCT GATTGGAGTT 
GGAACTGCAG CAAACTTCAA TATTAATATG GGTGCGAAAA GAGAGAAGGA GGCAAAGCAT 
TTTGTCGGAA CAGGTATTAC ACTGATGCCT ACCGTCGGAC TGTTAATTTT CTGTATTGTA 
TTTGTTCTGA AAAAACAAAT TCTTCTTCTT TGTGGTGCCA CGGAGAATGT ACTTCCCCTG 
GCTATGACCT ATCTCGGCAT TACAGCCATA GGACTGCCTT TCCAGCTCTT TACTACTGCA 
AGCAGCAGTT TGATTCGGGC TGACGGTAGC CCCACATATT CTATGATTTG TAATGTTACC 
GGTGCTATAT TGAATGTGTT CCTGGATTGG TTGTTCATGT TTGTATTTGG CTGGGGAATT 
CAAGGTGCTG CGACAGCAAC AGTGATTGGG CAGATTGTAT CCTTTCTCCT TTGTGCAATC 
TACTATTTTA AGTTCAGAAC CTTTCAAATA ACCCGAAGAA TGTTGGGTAT AAAATGGTAT 
TATGCAAAAC GGATTGCAAA ACTTGGAACT TCTAATTTCA TTAATCATAC CATTATGATG 
CTTGTAAACA TTGTTTTGAA TAATAGCCTG AAAATCTACG GCGCCATGTC CATTTACGGC 
AGCGATATTC CATTGGCAGT ATCCGGTATT ATTGCAAAAT TAAACAGTGT TCTTTCTGCC 
TTTTCCATTG GTTTGGCACA AGGATGTCAG CCAATTTTAG GTTTTAATAT GGGGGCGAAA 
AATTATTCCA GAGTGAAGGA AACTTATAAA AAAGCTGTCT CCATCGCTAT AGGTATTAGT 
GTTCTGGCTT TTATTTTGTT TCAATGCTTT CCGAGACAAA TTACCGGGAT TTTCGGAAGC 
GGAGATGAAC TATATGGAGA TGAACTGTAC TTTGAGTTTG CAGAGAAATA TCTGAAAATT 
TATATGTTTA TGGTATGCGT TTTTGGTATA CAGCCAGTGA CAATCAATTA CTTTACCGGT 
ACGGGAAATG TGAGGCAGGG AATTATACTT TCATTATCAA GGCAAGGTTT CTTTCTCATT 
CCTTTGCTTT TGATTCTGCC ACAATTTCTG GGACTGACCG GTGTTCTTTA TGCTGGTCCC 
ATAGCAGATT TCATGGCCTG CCTTCTGTCT CTTACCATGA TAACCTTAAA TTTTAAAAAA 
TTAGATTCCG GGCGAGAGGT AGCTGATAAA TGA

Protein sequence

MKDISANTSS SGNPLGYAPV LGLIGKFAIP SIISMLVAAA YNITDQIFIG RLVGMLGNGA 
TSVAFPVVTF TTAFAQLIGV GTAANFNINM GAKREKEAKH FVGTGITLMP TVGLLIFCIV 
FVLKKQILLL CGATENVLPL AMTYLGITAI GLPFQLFTTA SSSLIRADGS PTYSMICNVT 
GAILNVFLDW LFMFVFGWGI QGAATATVIG QIVSFLLCAI YYFKFRTFQI TRRMLGIKWY 
YAKRIAKLGT SNFINHTIMM LVNIVLNNSL KIYGAMSIYG SDIPLAVSGI IAKLNSVLSA 
FSIGLAQGCQ PILGFNMGAK NYSRVKETYK KAVSIAIGIS VLAFILFQCF PRQITGIFGS 
GDELYGDELY FEFAEKYLKI YMFMVCVFGI QPVTINYFTG TGNVRQGIIL SLSRQGFFLI 
PLLLILPQFL GLTGVLYAGP IADFMACLLS LTMITLNFKK LDSGREVADK