Gene EcSMS35_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1734
Symbol	ydcS
ID	6144278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1738437
End bp	1739582
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID	641616610
Product	ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001743788
Protein GI	170681458
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0000000404923
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAAGA TTTTTGCCCG CAGCAGCCTG TGTGCGCTCA CCATGACAAT AATGACCGCT 
CACGCCGCCG AACCGCCTAC CAATTTAGAT AAACCGGAAG GGCGACTGGA TATTATCGCC 
TGGCCGGGAT ACATCGAACG CGGACAAACT GATAATCAAT ACGACTGGGT AACGCAATTC 
GAAAAAGAGA CAGGCTGCGC GGTGAATGTG AAAACCGCCG CGACTTCCGA TGAAATGGTC 
AGTCTGATGA CCAAAGGGGG TTACGATCTG GTTACGGCAT CCGGCGATGC CTCGCTGCGC 
CTGATTATGG GCAAACGCGT GCAGCCGATT AATACCGCAT TGATTCCCAA CTGGAAAGCG 
CTCGATCCGC GCGTGGTTAA AGGCGACTGG TTTAACGTTG GCGGCAAAGT TTACGGCACA 
CCTTACCAAT GGGGGCCGAA CCTGCTGATG TACAACACTA AAACCTTCCC GACGCCGCCG 
AATAGCTGGC AAGTGGTTTT TGTTGAGCAG AATCTGCCGG ACGGCAAGAG CAATAAAGGC 
CGCGTTCAGG CTTATGATGG CCCTATCTAC ATTGCGGACG CTGCGTTGTT CGTTAAAGCC 
ACTCAGCCGC AGTTGGGCAT CAGCGATCCG TATCAACTCA CCGAAGAACA GTACCAGGCG 
GTGCTGAAAG TGCTGCGCGA TCAACATAGT TTGATCCATC GCTACTGGCA TGACACTACC 
GTGCAAATGA GCGATTTCAA AAACGAGGGT GTAGTTGCTT CCAGTGCATG GCCCTATCAG 
GCCAACGCCC TGAAAGCCGA AGGCCAGCCT GTCGCTACCG TTTTCCCGAA AGAGGGCGTT 
ACCGGTTGGG CTGACACCAC CATGCTACAT AGCGAAGCGA AACATCCGGT TTGCGCCTAC 
AAATGGATGA ACTGGTCATT AACCCCAAAA GTGCAGGGCG ATGTGGCGGC CTGGTTTGGC 
TCGCTACCAG TAGTGCCGCA AGGGTGTAAA GCCAGTCCGT TATTAGGCGA GAAAGGTTGT 
GAAACAAACG GTTTTAACTA TTTCGATAAA ATCGCCTTCT GGAAAACGCC TATAGCAGAA 
GGGGGCAAGT TTGTTCCCTA CAGTCGCTGG ACGCAGGATT ACATTGCCAT TATGGGTGGT 
CGCTAA

Protein sequence

MSKIFARSSL CALTMTIMTA HAAEPPTNLD KPEGRLDIIA WPGYIERGQT DNQYDWVTQF 
EKETGCAVNV KTAATSDEMV SLMTKGGYDL VTASGDASLR LIMGKRVQPI NTALIPNWKA 
LDPRVVKGDW FNVGGKVYGT PYQWGPNLLM YNTKTFPTPP NSWQVVFVEQ NLPDGKSNKG 
RVQAYDGPIY IADAALFVKA TQPQLGISDP YQLTEEQYQA VLKVLRDQHS LIHRYWHDTT 
VQMSDFKNEG VVASSAWPYQ ANALKAEGQP VATVFPKEGV TGWADTTMLH SEAKHPVCAY 
KWMNWSLTPK VQGDVAAWFG SLPVVPQGCK ASPLLGEKGC ETNGFNYFDK IAFWKTPIAE 
GGKFVPYSRW TQDYIAIMGG R