Gene EcHS_A1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1691
Symbol	uidB
ID	5592052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1714843
End bp	1716216
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	52%
IMG OID	640920839
Product	glucuronide transporter
Protein accession	YP_001458395
Protein GI	157161077
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAAC AACTCTCCTG GCGCACCATC GTCGGCTACA GCCTCGGTGA CGTCGCCAAT 
AACTTCGCCT TCGCAATGGG GGCGCTCTTC CTGTTGAGTT ACTACACCGA CGTCGCTGGC 
GTCGGTGCCG CTGCGGCGGG CACCATGCTG TTACTGGTGC GGGTATTCGA TGCCTTCGCC 
GACGTCTTTG CCGGACGAGT GGTGGACAGT GTGAATACCC GCTGGGGAAA ATTCCGCCCG 
TTTTTACTCT TCGGTACTGC GCCGTTAATG ATCTTCAGCG TGCTGGTATT CTGGGTGCCG 
ACCGACTGGA GCCATGGTAG CAAAGTGGTG TATGCATATT TGACCTACAT GGGCCTCGGG 
CTTTGCTACA GCCTGGTGAA TATTCCTTAT GGTTCACTTG CTACCGCGAT GACCCAACAA 
CCACAATCCC GCGCCCGTCT GGGCGCGGCT CGTGGGATTG CCGCTTCATT GACCTTTGTC 
TGCCTGGCAT TTCTGATAGG ACCGAGCATT AAGAACTCCA GCCCGGAAGA GATGGTGTCG 
GTATACCATT TCTGGACAAT TGTGCTGGCG ATTGCCGGAA TGGTGCTTTA CTTCATCTGC 
TTCAAATCGA CGCGTGAGAA TGTGGTACGT ATCGTTGCGC AGCCGTCATT GAATATCAGT 
CTGCAAACCC TGAAACGGAA TCGCCCGCTG TTTATGTTGT GCATCGGTGC GCTGTGTGTG 
CTGATTTCGA CCTTTGCGGT CAGCGCCTCG TCGTTGTTCT ACGTGCGCTA TGTGTTAAAT 
GATACCGGGC TGTTCACTGT GCTGGTACTG GTGCAAAACC TGGTTGGTAC TGTGGCATCG 
GCACCGCTGG TGCCGGGGAT GGTCGCGAGG ATCGGTAAAA AGAATACCTT CCTGATTGGC 
GCTTTGCTGG GAACCTGCGG TTATCTGCTG TTCTTCTGGG TTTCCGTCTG GTCACTGCCG 
GTGGCGTTGG TTGCGTTGGC CATCGCTTCA ATTGGTCAGG GCGTTACCAT GACCGTGATG 
TGGGCGCTGG AAGCTGATAC CGTAGAATAC GGTGAATACC TGACCGGCGT GCGAATTGAA 
GGGCTCACCT ATTCACTATT CTCATTTACC CGTAAATGCG GTCAGGCAAT CGGAGGTTCA 
ATTCCTGCCT TTATTTTGGG GTTAAGCGGA TATATCGCCA ATCAGGTGCA AACGCCGGAA 
GTTATTATGG GCATCCGCAC ATCAATTGCC TTAGTACCTT GCGGATTTAT GCTACTGGCA 
TTCGTTATTA TCTGGTTTTA TCCGCTCACG GATAAAAAAT TCAAAGAAAT CGTGGTTGAA 
ATTGATAATC GTAAAAAAGT GCAGCAGCAA TTAATCAGCG ATATCACTAA TTAA

Protein sequence

MNQQLSWRTI VGYSLGDVAN NFAFAMGALF LLSYYTDVAG VGAAAAGTML LLVRVFDAFA 
DVFAGRVVDS VNTRWGKFRP FLLFGTAPLM IFSVLVFWVP TDWSHGSKVV YAYLTYMGLG 
LCYSLVNIPY GSLATAMTQQ PQSRARLGAA RGIAASLTFV CLAFLIGPSI KNSSPEEMVS 
VYHFWTIVLA IAGMVLYFIC FKSTRENVVR IVAQPSLNIS LQTLKRNRPL FMLCIGALCV 
LISTFAVSAS SLFYVRYVLN DTGLFTVLVL VQNLVGTVAS APLVPGMVAR IGKKNTFLIG 
ALLGTCGYLL FFWVSVWSLP VALVALAIAS IGQGVTMTVM WALEADTVEY GEYLTGVRIE 
GLTYSLFSFT RKCGQAIGGS IPAFILGLSG YIANQVQTPE VIMGIRTSIA LVPCGFMLLA 
FVIIWFYPLT DKKFKEIVVE IDNRKKVQQQ LISDITN