Gene EcHS_A1524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1524
Symbol	ydcS
ID	5594940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1532084
End bp	1533229
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID	640920679
Product	ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001458235
Protein GI	157160917
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGA CATTTGCCCG CAGCAGCCTG TGTGCGCTCA GCATGACAAT AATGACCGCT 
CACGCCGCCG AACCGCCTAC CAATTTAGAT AAACCGGAAG GGCGACTGGA TATTATCGCC 
TGGCCGGGAT ACATCGAACG CGGACAAACT GATAAACAAT ACGACTGGGT AACGCAGTTC 
GAAAAAGAGA CAGGCTGCGC GGTGAATGTG AAAACCGCCG CGACTTCCGA TGAAATGGTC 
AGTCTGATGA CCAAAGGGGG TTACGATCTG GTTACGGCAT CCGGCGATGC CTCGCTGCGT 
TTGATTATGG GTAAACGCGT GCAGCCGATT AATACCGCAT TGATTCCCAA CTGGAAAACG 
CTCGATCCGC GCGTGGTTAA AGGCGACTGG TTTAATGTTG GCGGCAAAGT TTACGGCACA 
CCTTACCAAT GGGGGCCGAA CCTGCTGATG TACAACACTA AAACCTTCCC GACGCCGCCG 
GATAGCTGGC AAGTGGTTTT TGTTGAGCAA AATCTGCCGG ACGGCAAGAG CAATAAAGGC 
CGCGTTCAGG CTTATGATGG CCCTATCTAC ATTGCGGACG CTGCGTTGTT CGTTAAAGCC 
ACTCAGCCGC AGTTGGGCAT CAGCGATCCG TATCAACTCA CCGAAGAACA GTACCAGGCG 
GTGCTGAAAG TGCTGCGCGC TCAACACAGT TTGATCCATC GCTACTGGCA TGACAATACC 
GTGCAAATGA GCGATTTCAA AAACGAGGGT GTGGTTGCTT CCAGTGCCTG GCCCTATCAG 
GCCAACGCCC TGAAAGCCGA AGGCCAGCCT GTTGCTACCG TTTTCCCGAA GGAGGGTGTT 
ACCGGTTGGG CTGATACCAC CATGCTGCAT AGCGAAGCGA AACATCCGGT TTGCGCCTAC 
AAATGGATGA ACTGGTCATT AACGCCAAAA GTGCAGGGCG ATGTGGCGGC CTGGTTTGGC 
TCGTTACCGG TAGTGCCGGA AGGGTGTAAA GCCAGTCCGT TATTAGGCGA AAAAGGTTGT 
GAAACCAACG GTTTTAACTA TTTCGACAAA ATCGCCTTCT GGAAAACGCC TATAGCAGAA 
GGGGGCAAGT TTGTTCCCTA CAGTCGCTGG ACGCAGGATT ACATTGCCAT TATGGGCGGT 
CGCTAA

Protein sequence

MSKTFARSSL CALSMTIMTA HAAEPPTNLD KPEGRLDIIA WPGYIERGQT DKQYDWVTQF 
EKETGCAVNV KTAATSDEMV SLMTKGGYDL VTASGDASLR LIMGKRVQPI NTALIPNWKT 
LDPRVVKGDW FNVGGKVYGT PYQWGPNLLM YNTKTFPTPP DSWQVVFVEQ NLPDGKSNKG 
RVQAYDGPIY IADAALFVKA TQPQLGISDP YQLTEEQYQA VLKVLRAQHS LIHRYWHDNT 
VQMSDFKNEG VVASSAWPYQ ANALKAEGQP VATVFPKEGV TGWADTTMLH SEAKHPVCAY 
KWMNWSLTPK VQGDVAAWFG SLPVVPEGCK ASPLLGEKGC ETNGFNYFDK IAFWKTPIAE 
GGKFVPYSRW TQDYIAIMGG R