Gene EcolC_2385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2385
Symbol
ID	6067119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2623814
End bp	2625490
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	47%
IMG OID	641601788
Product	extracellular solute-binding protein
Protein accession	YP_001725347
Protein GI	170020393
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.190524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000021243
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGGTTA ATACCAGTAA TTATAATGAG GGAGTCCAAA AAACAATGAC CAACATCACC 
AAGAGAAGTT TAGTAGCAGC TGGCGTTCTG GCTGCGCTAA TGGCAGGGAA TGTCGCGCTG 
GCAGCTGATG TACCCGCAGG CGTCACACTG GCGGAAAAAC AAACACTGGT ACGTAACAAT 
GGTTCAGAAG TTCAGTCATT AGATCCGCAC AAAATTGAAG GTGTTCCGGA GTCTAATATC 
AGCCGAGACC TGTTTGAAGG CTTACTGGTC AGCGATCTTG ACGGTCATCC AGCACCTGGC 
GTCGCTGAAT CCTGGGATAA TAAAGACGCG AAAGTCTGGA CCTTCCATTT GCGTAAAGAT 
GCGAAATGGT CTGATGGCAC GCCAGTCACA GCACAAGACT TTGTGTATAG CTGGCAACGT 
TCTGTTGATC CGAACACTGC TTCTCCGTAT GCCAGTTATC TGCAATATGG GCATATCGCC 
GGTATTGATG AAATTCTTGA AGGGAAAAAA CCGATTACCG ATCTCGGCGT GAAAGCTATT 
GATGATCACA CATTAGAAGT CACCTTAAGT GAACCCGTTC CGTACTTCTA TAAATTACTT 
GTTCACCCAT CAACTTCACC GGTGCCAAAA GCCGCTATCG AGAAATTCGG CGAAAAATGG 
ACCCAGCCTG GTAATATCGT CACCAACGGT GCCTATACCT TAAAAGATTG GGTCGTAAAC 
GAACGAATCG TTCTTGAACG CAGCCCGACC TACTGGAACA ACGCGAAAAC CGTTATTAAC 
CAGGTAACCT ATTTGCCTAT TGCTTCTGAA GTTACCGATG TCAACCGCTA CCGTAGTGGT 
GAAATCGACA TGACTTATAA CAACATGCCG ATCGAATTGT TCCAGAAGCT GAAAAAAGAG 
ATCCCGGACG AAGTTCACGT TGATCCATAC CTGTGCACTT ACTATTACGA AATTAACAAC 
CAGAAACCGC CATTCAACGA TGTGCGTGTG CGTACCGCAC TGAAACTAGG TATGGACCGC 
GATATCATTG TTAATAAAGT GAAAGCGCAG GGCGACATGC CCGCCTATGG TTACACTCCA 
CCGTATACTG ATGGCGCAAA ATTGACTCAG CCGGAATGGT TTGGCTGGAG CCAGGAAAAA 
CGTAACGAAG AAGCGAAAAA ACTGCTGGCT GAAGCGGGTT ATACCGCAGA CAAACCGTTG 
ACCATCAACC TGTTGTATAA CACCTCCGAT CTGCATAAAA AGCTGGCGAT TGCTGCCTCT 
TCATTGTGGA AGAAAAACAT TGGTGTAAAC GTCAAACTGG TTAACCAGGA GTGGAAAACG 
TTCCTCGACA CCCGTCACCA GGGTACTTTT GATGTGGCCC GTGCAGGCTG GTGTGCTGAC 
TACAACGAAC CAACTTCCTT CCTGAACACC ATGCTTTCGA ACAGCTCGAT GAATACCGCG 
CATTATAAGA GCCCGGCCTT TGACAGCATT ATGGCGGAAA CGCTGAAAGT GACTGACGAG 
GCGCAGCGCA CAGCTCTGTA CACTAAAGCA GAACAACAGC TGGATAAGGA TTCGGCCATT 
GTTCCTGTTT ATTACTACGT GAATGCGCGT CTGGTGAAAC CGTGGGTTGG TGGCTATACC 
GGCAAAGATC CGCTGGATAA TACCTATACC CGGAATATGT ACATTGTGAA GCACTAA

Protein sequence

MLVNTSNYNE GVQKTMTNIT KRSLVAAGVL AALMAGNVAL AADVPAGVTL AEKQTLVRNN 
GSEVQSLDPH KIEGVPESNI SRDLFEGLLV SDLDGHPAPG VAESWDNKDA KVWTFHLRKD 
AKWSDGTPVT AQDFVYSWQR SVDPNTASPY ASYLQYGHIA GIDEILEGKK PITDLGVKAI 
DDHTLEVTLS EPVPYFYKLL VHPSTSPVPK AAIEKFGEKW TQPGNIVTNG AYTLKDWVVN 
ERIVLERSPT YWNNAKTVIN QVTYLPIASE VTDVNRYRSG EIDMTYNNMP IELFQKLKKE 
IPDEVHVDPY LCTYYYEINN QKPPFNDVRV RTALKLGMDR DIIVNKVKAQ GDMPAYGYTP 
PYTDGAKLTQ PEWFGWSQEK RNEEAKKLLA EAGYTADKPL TINLLYNTSD LHKKLAIAAS 
SLWKKNIGVN VKLVNQEWKT FLDTRHQGTF DVARAGWCAD YNEPTSFLNT MLSNSSMNTA 
HYKSPAFDSI MAETLKVTDE AQRTALYTKA EQQLDKDSAI VPVYYYVNAR LVKPWVGGYT 
GKDPLDNTYT RNMYIVKH