Gene Cthe_0743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0743
Symbol
ID	4810361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	905340
End bp	906794
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	43%
IMG OID	640106160
Product	MATE efflux family protein
Protein accession	YP_001037171
Protein GI	125973261
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000192336
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA CACTTTACAT AAAAAGTATT TTGCCAAGGC TCAAAAGAAC GTTTATAGGT 
GACAAGAAAT TTTATAAAAC TGTACTGGCA CTTGTCATAC CGATTATAAT TCAAAACTCC 
ATTACCAATT TTGTAAATCT TCTGGACAAT ATAATGATCG GACAGGTGGG AACGGCTCAA 
ATGTCCGGCG TGGCAATTGC CAACCAGCTT ATGTTTGTGT TCTATCTTGC GGTGTTTGGA 
GGATTGGCCG GTGCCGGCAT TTTTGCTGCG CAGTTCTTTG GAGCGGGAGA TAATGAAGGA 
CTTAGATATA CATTAAGATA TAAACTGTGG GCTTCTGCTG TGATATTGGC AGTTGCACTG 
GCAGTATTTT TATCCGGAGG AGATTGGTTG ATTTCTCTGT TCCTCAAAGG AGAAGGAGAT 
CCTTCGGAAG CGGCAGCAAT ACTGGAGTAC GGACGTGTCT ATCTTAGAAT AATGCTTTGG 
GGGCTTTTGC CTTTTATATT GTCACAGGTA TATGGAAGTA CCCTCAGAGA GATCGGCGAT 
ACAATGGTAC CAATGGTAGC AAGTGTAGCT GCTGTGTTAA CAAACCTGTG TTTTAACTGG 
GTATTGATAT TCGGTAAACT GGGTTTTCCT GAAATGGGAG TTGCAGGTGC TGCCATTGCA 
ACGGTTATAT CCCGATATGT GGAACTGGTG ATCATAGCTG TGTATACCCA TATGAATACT 
GCACGGTTTG GGTTCGTGGC TGGGGTTTAC CGCTCCATGA GAGTTCCGAG AGGCCTTGCA 
CTGACAATAT TCAACAAAGG CATGCCGTTG CTGGCTAATG AAGTTTTGTG GGCAGTCGGA 
GTGTCAGCAT TGACGCAAAT ATTCTCTACG TACAATCTCA ACGTTGTTGG GGCTCTCAAT 
ATAGCAAATA CGATAACAAA TTTGTTCAAT GTGGCATTCA TATCGATGGG GTCGGCGGTT 
GCCGTCATGG TTGGACAGGC CCTTGGTGCG GGGGATATGC AACGGGCAAA AGAATATTCA 
TGGAAGTTGA TTTTTTTCAG TGTATGCACC TGTATTATAA TAGGAGCTGT ACTTGTGGCC 
GTAGCGCCTG TAATACCGCG TATATATAAT ACGACCGAAG ATGTGCGAAA ACTTTCCGCT 
CATTTTATGA TAGTAAGTGC CTTTTATATG CCGTTTTTTG CCATATCACA CTGTGCTTAT 
TTTACCATAC GTTCGGGAGG CAAGACGTTT ATCACTCTTG TTTTTGACAG TGCATATACA 
TGGGGCGTGA TTGTTCCTGT GGCTTATTTG ATTGCAAAGT ATGCGGATTT TGATATTTAT 
ACGGCCTATC CGGTTTGTTA TTTTCCTGAT GTCCTGAAGA GTGTGCTGGG ATTGTATATA 
ATAAAGAAAG GCCGTTGGGC TCAGAATATC GTGGCAAACG GCACCGAGTC TGAAGGTGTG 
CGCTGCTTTG GATAG

Protein sequence

MNKTLYIKSI LPRLKRTFIG DKKFYKTVLA LVIPIIIQNS ITNFVNLLDN IMIGQVGTAQ 
MSGVAIANQL MFVFYLAVFG GLAGAGIFAA QFFGAGDNEG LRYTLRYKLW ASAVILAVAL 
AVFLSGGDWL ISLFLKGEGD PSEAAAILEY GRVYLRIMLW GLLPFILSQV YGSTLREIGD 
TMVPMVASVA AVLTNLCFNW VLIFGKLGFP EMGVAGAAIA TVISRYVELV IIAVYTHMNT 
ARFGFVAGVY RSMRVPRGLA LTIFNKGMPL LANEVLWAVG VSALTQIFST YNLNVVGALN 
IANTITNLFN VAFISMGSAV AVMVGQALGA GDMQRAKEYS WKLIFFSVCT CIIIGAVLVA 
VAPVIPRIYN TTEDVRKLSA HFMIVSAFYM PFFAISHCAY FTIRSGGKTF ITLVFDSAYT 
WGVIVPVAYL IAKYADFDIY TAYPVCYFPD VLKSVLGLYI IKKGRWAQNI VANGTESEGV 
RCFG