Gene EcHS_A4051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4051
Symbol
ID	5595352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4041553
End bp	4042452
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	55%
IMG OID	640923155
Product	10 TMS drug/metabolite exporter (DME) family protein
Protein accession	YP_001460621
Protein GI	157163303
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID	[TIGR00950] Carboxylate/Amino Acid/Amine Transporter

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGCTAC TTATCATCAC CACGATTCTG TGGGCCTTCT CCTTTAGCTT TTATGGCGAG 
TACCTTGCGG GGCACGTCGA TAGCTATTTT GCGGTGCTGG TGCGCGTTGG CCTGGCGGCA 
CTCGTTTTTC TGCCGTTTCT GCGTACCCGT GGCAATAGCC TGAAAACAGT CGGCCTGTAT 
ATGCTGGTGG GCGCGATGCA GCTCGGCGTG ATGTATATGC TGAGTTTCCG CGCTTATCTC 
TACCTGACGG TTTCCGAACT GCTGCTGTTC ACCGTACTGA CGCCGCTCTA CATCACGCTG 
ATTTATGACA TCATGAGTAA GCGCCGTCTG CGCTGGGGAT ATGCTTTTAG TGCCTTGTTG 
GCGGTGATTG GTGCCGGGAT TATTCGCTAT GATCAGGTCA CCGACCATTT CTGGACTGGC 
TTGTTGCTGG TGCAACTCTC CAATATCACT TTTGCCATCG GCATGGTGGG TTACAAACGC 
CTGATGGAAA CTCGCCCGAT GCCGCAGCAT AACGCCTTTG CGTGGTTCTA TCTTGGCGCG 
TTCCTGGTGG CGGTAATTGC ATGGTTCTTG CTGGGAAATA CGCAGAAAAT GCCGCAAACC 
ACGTTGCAAT GGGGCATTCT GGTGTTTCTT GGCGTGGTGG CTTCCGGGAT TGGCTACTTT 
ATGTGGAACT ACGGCGCGAC GCAGGTGGAC GCCGGAACGC TGGGCATTAT GAATAATATG 
CACGTTCCGG CAGGGCTGCT GGTAAACCTG GCTATCTGGC ACCAACAGCC GCACTGGCCA 
ACGTTCATTA CAGGCGCGCT GGTGATCCTG GCCTCACTGT GGGTGCATCG TAAGTGGGTC 
GCTCCGCGCT CTTCACAAAC GGCAGATGAT CGCAGGCGTG ATTGCGCGCT GAGCGAATAA

Protein sequence

MALLIITTIL WAFSFSFYGE YLAGHVDSYF AVLVRVGLAA LVFLPFLRTR GNSLKTVGLY 
MLVGAMQLGV MYMLSFRAYL YLTVSELLLF TVLTPLYITL IYDIMSKRRL RWGYAFSALL 
AVIGAGIIRY DQVTDHFWTG LLLVQLSNIT FAIGMVGYKR LMETRPMPQH NAFAWFYLGA 
FLVAVIAWFL LGNTQKMPQT TLQWGILVFL GVVASGIGYF MWNYGATQVD AGTLGIMNNM 
HVPAGLLVNL AIWHQQPHWP TFITGALVIL ASLWVHRKWV APRSSQTADD RRRDCALSE