Gene EcSMS35_4194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4194
Symbol
ID	6147246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4292387
End bp	4293286
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	55%
IMG OID	641619017
Product	10 TMS drug/metabolite exporter (DME) family protein
Protein accession	YP_001746145
Protein GI	170682387
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID	[TIGR00950] Carboxylate/Amino Acid/Amine Transporter

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.00209407
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCGCTAC TTATCATCAC CACGATTCTG TGGGCCTTCT CCTTTAGCTT TTATGGCGAG 
TACCTTGCGG GGCACGTCGA TAGCTATTTT GCGGTGCTGG TGCGCGTTGG CCTGGCGGCA 
CTCGTTTTTC TGCCGTTTCT GCGTACCCGT GGCAATAGCC TGAAAACGGT CGGCCTGTAT 
ATGCTGGTGG GCGCGATGCA GCTCGGTGTG ATGTATATGC TGAGTTTCCG CGCCTATCTC 
TACCTGACGG TCTCCGAACT GTTGCTGTTC ACCGTACTGA CGCCGCTCTA CATCACGCTG 
ATTTATGACA TCATGAGTAA GCGCCGTCTG CGCTGGGGCT ATGCTTTTAG CGCCTTGCTG 
GCGGTGATTG GTGCCGGGAT TATTCGCTAT GATCAGGTCA CCGACCATTT CTGGACTGGC 
TTATTGCTGG TGCAACTCTC CAATATCACT TTTGCCATCG GCATGGTGGG TTACAAACGT 
CTGATGGAAA CTCGCCCGAT GCCGCAGCAT AACGCCTTTG CGTGGTTCTA TCTTGGCGCG 
TTCCTGGTGG CAGTGATTGC ATGGTTCTTG CTAGGAAATG CGCAGAAAAT GCCGCAAACC 
ACGTTGCAAT GGGGCATTCT GGTGTTTCTT GGCGTGGTGG CTTCCGGGAT TGGCTACTTT 
ATGTGGAACT ACGGCGCGAC GCAGGTGGAC GCCGGAACGC TGGGCATTAT GAATAATATG 
CACGTTCCGG CAGGGCTGCT GGTAAACCTG GCTATCTGGC ACCAACAGCC GCACTGGCCA 
ACGTTTATTA CAGGCGCGCT GGTGATCCTG GCCTCACTGT GGGTGCATCG TAAGTGGGTC 
GCTCCGCGCT CTTCACAAAC GGCAGATGAT CGCAGGCGTG ATTGCGCGCT GAACGAATAA

Protein sequence

MALLIITTIL WAFSFSFYGE YLAGHVDSYF AVLVRVGLAA LVFLPFLRTR GNSLKTVGLY 
MLVGAMQLGV MYMLSFRAYL YLTVSELLLF TVLTPLYITL IYDIMSKRRL RWGYAFSALL 
AVIGAGIIRY DQVTDHFWTG LLLVQLSNIT FAIGMVGYKR LMETRPMPQH NAFAWFYLGA 
FLVAVIAWFL LGNAQKMPQT TLQWGILVFL GVVASGIGYF MWNYGATQVD AGTLGIMNNM 
HVPAGLLVNL AIWHQQPHWP TFITGALVIL ASLWVHRKWV APRSSQTADD RRRDCALNE