Gene EcHS_A1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1810
Symbol
ID	5595118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1827735
End bp	1829126
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	52%
IMG OID	640920955
Product	sodium/dicarboxylate symporter family protein
Protein accession	YP_001458507
Protein GI	157161189
COG category	[R] General function prediction only
COG ID	[COG1823] Predicted Na+/dicarboxylate symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTTC CATTAATTGC GAACATCGTG GTGTTCGTTG TACTGCTGTT TGCGCTGGCT 
CAGACCCGCC ATAAACAGTG GAGTCTGGCG AAAAAAGTGC TGGTGGGTCT GGTGATGGGT 
GTGGTTTTTG GCCTTGCCCT GCATACCATT TATGGTTCTG ACAGCCAGGT ACTTAAAGAT 
TCTGTACAGT GGTTTAACAT CGTTGGTAAC GGCTATGTTC AACTGCTGCA AATGATCGTT 
ATGCCGTTAG TCTTCGCCTC TATTCTGAGC GCGGTTGCCC GTCTGCATAA CGCATCTCAG 
TTAGGCAAAA TCAGTTTTCT GACCATCGGT ACGCTTTTGT TTACCACGCT GATTGCGGCG 
CTGGTCGGTG TGCTGGTCAC CAACCTGTTT GGTTTGACGG CTGAAGGTCT GGTTCAGGGT 
GGTGCAGAAA CTGCACGTCT GAACGCCATT GAAAGTAACT ATGTTGGTAA AGTCTCTGAT 
CTGAGCGTTC CGCAGCTGGT CTTGTCCTTT ATCCCGAAAA ACCCGTTTGC CGATCTTACC 
GGAGCCAATC CGACGTCAAT TATCAGCGTG GTAATTTTTG CCGCATTCCT CGGCGTAGCT 
GCATTGAAAC TGCTGAAGGA TGATGCTCCG AAAGGTGAAC GCGTCTTAGC CGCTATCGAT 
ACCCTACAAA GCTGGGTGAT GAAACTGGTT CGCCTGGTCA TGCAGTTGAC CCCTTACGGC 
GTTCTGGCTC TAATGACCAA AGTGGTTGCA GGTTCTAACT TGCAAGACAT CATCAAACTG 
GGAAGTTTCG TTGTCGCGTC CTACCTCGGT CTGCTGATTA TGTTTGCAGT GCATGGCATT 
CTGCTGGGCA TTAATGGCGT GAGTCCGCTG AAGTACTTCC GTAAGGTATG GCCTGTGCTG 
ACGTTTGCCT TTACCAGCCG TTCCAGTGCT GCGTCTATCC CACTGAATGT GGAAGCACAA 
ACGCGTCGTC TGGGCGTTCC TGAATCCATC GCCAGTTTCG CCGCCTCTTT CGGTGCAACC 
ATTGGTCAGA ACGGCTGCGC CGGTTTGTAT CCGGCAATGC TGGCGGTGAT GGTTGCGCCT 
ACGGTTGGCA TTAACCCGCT GGACCCGATG TGGATTGCGA CGCTGGTCGG TATTGTTACC 
GTTAGTTCCG CAGGCGTTGC CGGTGTCGGT GGTGGTGCAA CTTTCGCCGC ACTGATTGTA 
CTGCCTGCGA TGGGCCTGCC AGTAACCCTG GTGGCGCTGT TAATCTCCGT TGAACCGCTT 
ATCGACATGG GCCGTACGGC GTTAAACGTT AGTGGCTCGA TGACAGCTGG CACGCTGACC 
AGCCAGTGGC TGAAGCAAAC CGATAAAGCC ATTCTGGATA GCGAAGACGA CGCCGAACTG 
GCACACCATT AA

Protein sequence

MNFPLIANIV VFVVLLFALA QTRHKQWSLA KKVLVGLVMG VVFGLALHTI YGSDSQVLKD 
SVQWFNIVGN GYVQLLQMIV MPLVFASILS AVARLHNASQ LGKISFLTIG TLLFTTLIAA 
LVGVLVTNLF GLTAEGLVQG GAETARLNAI ESNYVGKVSD LSVPQLVLSF IPKNPFADLT 
GANPTSIISV VIFAAFLGVA ALKLLKDDAP KGERVLAAID TLQSWVMKLV RLVMQLTPYG 
VLALMTKVVA GSNLQDIIKL GSFVVASYLG LLIMFAVHGI LLGINGVSPL KYFRKVWPVL 
TFAFTSRSSA ASIPLNVEAQ TRRLGVPESI ASFAASFGAT IGQNGCAGLY PAMLAVMVAP 
TVGINPLDPM WIATLVGIVT VSSAGVAGVG GGATFAALIV LPAMGLPVTL VALLISVEPL 
IDMGRTALNV SGSMTAGTLT SQWLKQTDKA ILDSEDDAEL AHH