Gene EcolC_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2219
Symbol
ID	6064924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2438542
End bp	2439687
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID	641601625
Product	extracellular solute-binding protein
Protein accession	YP_001725184
Protein GI	170020230
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA CATTTGCCCG CAGCAGCCTG TGTGCGCTCA GCATGACAAT AATGACCGCT 
CACGCCGCCG AACCGCCTAC CAATTTAGAT AAACCGGAAG GGCGACTGGA TATTATCGCC 
TGGCCGGGAT ACATCGAACG CGGACAAACT GATAAACAAT ACGACTGGGT AACGCAGTTC 
GAAAAAGAGA CAGGCTGCGC GGTGAATGTG AAAACCGCCG CGACTTCCGA TGAAATGGTC 
AGTCTGATGA CCAAAGGGGG TTACGATCTG GTTACGGCAT CCGGCGATGC CTCGCTGCGT 
TTGATTATGG GTAAACGCGT GCAGCCGATT AATACCGCAT TGATTCCCAA CTGGAAAACG 
CTCGATCCGC GCGTGGTTAA AGGCGACTGG TTTAATGTTG GCGGCAAAGT TTACGGCACA 
CCTTACCAAT GGGGGCCGAA CCTGCTGATG TACAACACTA AAACCTTCCC GACGCCGCCG 
GATAGCTGGC AAGTGGTTTT TGTTGAGCAA AATCTGCCGG ACGGCAAGAG CAATAAAGGC 
CGCGTTCAGG CTTATGATGG CCCTATCTAC ATTGCGGACG CTGCGTTGTT CGTTAAAGCC 
ACTCAGCCGC AGTTGGGCAT CAGCGATCCG TATCAACTCA CCGAAGAACA GTACCAGGCG 
GTGCTGAAAG TGCTGCGCGC TCAACACAGT TTGATCCATC GCTACTGGCA TGACACTACC 
GTGCAAATGA GCGATTTCAA AAACGAGGGT GTGGTTGCTT CCAGTGCCTG GCCCTATCAG 
GCCAACGCCC TGAAAGCCGA AGGCCAGCCT GTTGCTACCG TTTTCCCGAA GGAGGGTGTT 
ACCGGTTGGG CTGATACCAC CATGCTGCAT AGCGAAACGA AACATCCGGT TTGCGCCTAC 
AAATGGATGA ACTGGTCATT AACGCCAAAA GTGCAGGGCG ATGTGGCGGC CTGGTTTGGC 
TCGTTACCGG TAGTGCCGGA AGGGTGTAAA GCCAGTCCGT TATTAGGCGA AAAAGGTTGT 
GAAACCAACG GTTTTAACTA TTTCGACAAA ATCGCCTTCT GGAAAACGCC TATAGCAGAA 
GGGGGCAAGT TTGTTCCCTA CAGTCGCTGG ACGCAGGATT ACATTGCCAT TATGGGCGGT 
CGCTAA

Protein sequence

MSKTFARSSL CALSMTIMTA HAAEPPTNLD KPEGRLDIIA WPGYIERGQT DKQYDWVTQF 
EKETGCAVNV KTAATSDEMV SLMTKGGYDL VTASGDASLR LIMGKRVQPI NTALIPNWKT 
LDPRVVKGDW FNVGGKVYGT PYQWGPNLLM YNTKTFPTPP DSWQVVFVEQ NLPDGKSNKG 
RVQAYDGPIY IADAALFVKA TQPQLGISDP YQLTEEQYQA VLKVLRAQHS LIHRYWHDTT 
VQMSDFKNEG VVASSAWPYQ ANALKAEGQP VATVFPKEGV TGWADTTMLH SETKHPVCAY 
KWMNWSLTPK VQGDVAAWFG SLPVVPEGCK ASPLLGEKGC ETNGFNYFDK IAFWKTPIAE 
GGKFVPYSRW TQDYIAIMGG R