Gene EcE24377A_2475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2475
Symbol
ID	5587442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2460653
End bp	2462467
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	51%
IMG OID	640926135
Product	ABC transporter, peripllasmic solute-binding proteins
Protein accession	YP_001463530
Protein GI	157157339
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTGC GCATACTGCT GCTGTTTATC GCTCTGTTCA CCTTTGGTGC GCAGGCGCAG 
GCTATCAAGG AAAGCTATGC CTTTGCCGTG CTGGGCGAAC CCCGGTACGC GTTTAATTTC 
AACCATTTTG ATTATGTGAA CCCCGCCGCG CCAAAAGGTG GGCAGATAAC GTTGTCAGCC 
CTCGGTACCT TCGATAATTT CAACCGCTAT GCACTGCGCG GCAACCCGGG CGCACGCACC 
GAGCAGCTGT ACGACACGCT ATTTACGACT TCCGATGACG AACCAGGCAG TTATTACCCG 
CTGATTGCTG AAAGCGCACG CTATGCTGAC GATTATTCCT GGGCGGAGGT CGCTATTAAT 
CCGCGCGCCC GTTTTCATGA TGGTTCGCCC ATTACTGCCC GCGATGTAGA GTTTACTTTT 
CAAAAATTTA TGACCGAAGG CGTGCCGCAA TTTCGTCTGG TCTACAAAGG CACCACCGTC 
AAAGCCATTG CGCCGTTAAC CGTGCGCATT GAGTTAGCTA AACCCGGCAA AGAAGATATG 
TTGAGTCTGT TTTCGCTGCC GGTATTTCCA GAAAAGTACT GGAAGGATCA CAAACTTAGC 
GATCCGCTCG CCACGCCTCC GCTTGCCAGT GGTCCGTACC GAATTACGTC CTGGAAAATG 
GGGCAAAATA TTGTCTATTC CCGCGTGAAA GATTACTGGG CAGCAAACTT ACCGGTAAAC 
CGTGGACGCT GGAATTTCGA CACCATTCGC TACGATTATT ACCTCGATGA TAATGTCGCC 
TTTGAAGCGT TTAAAGCAGG TGCCTTTGAT TTGCGTATGG AAAACGACGC TAAAAACTGG 
GCCACGCGTT ATACCGGTAA AAATTTCGAT AAAAAATACA TCATCAAAGA TGAGCAAAAG 
AACGAATCAG CCCAGGATAC GCGCTGGCTG GCGTTTAATA TCCAACGTCC GGTATTCAGC 
GATCGCCGGG TCCGGGAAGC AATCACCCTC GCCTTTGACT TTGAATGGAT GAACAAGGCG 
TTGTTTTACA ATGCCTGGAG TCGCACGAAC AGTTATTTTC AGAATACCGA ATACGCGGCC 
AGAAATTACC CCGACGCCGC GGAGCTGGTG CTTCTGGCAC CAATGAAAAA AGATCTACCG 
TCAGAAGTCT TCACACAAAT CTACCAGCCG CCGGTATCTA AAGGCGATGG CTACGATCGT 
GACAACCTGT TAAAAGCCGA CAAACTTCTC AACGAAGCGG GCTGGGTGCT GAAGGGTCAG 
CAACGCGTTA ATGCCACAAC GGGTCAGCCA CTCAGCTTTG AATTATTGCT TCCCGCAAGC 
AGCAATAGTC AGTGGGTATT GCCGTTCCAG CACAGCCTGC AACGGCTGGG TATCAACATG 
GACATTCGCA AGGTGGATAA CTCGCAAATC ACCAACCGCA TGCGCAGTCG CGACTATGAC 
ATGATGCCGC GCGTATGGCG GGCGATGCCG TGGCCCAGTT CCGATTTACA GATTTCCTGG 
TCATCGGAAT ATATCAATTC CACTTATAAT GCCCCCGGCG TGCAAAGTCC GGTTATCGAC 
TCGCTGATCA ATCAAATTAT TGCCGCGCAG GGAAATAAAG AAAAATTACT GCCGTTAGGG 
CGAGCACTGG ATCGCGTATT AACGTGGAAT TATTACATGC TGCCAATGTG GTACATGGCG 
GAAGACCGTC TCGCCTGGTG GGATAAATTC TCCCAACCCG CTGTACGCCC TGTTTACAGC 
CTGGGTATCG ATACCTGGTG GTATGACGTT AATAAAGCGG CCAAACTGCC GTCAGCCAGA 
CAACAGGGAG AGTAG

Protein sequence

MIVRILLLFI ALFTFGAQAQ AIKESYAFAV LGEPRYAFNF NHFDYVNPAA PKGGQITLSA 
LGTFDNFNRY ALRGNPGART EQLYDTLFTT SDDEPGSYYP LIAESARYAD DYSWAEVAIN 
PRARFHDGSP ITARDVEFTF QKFMTEGVPQ FRLVYKGTTV KAIAPLTVRI ELAKPGKEDM 
LSLFSLPVFP EKYWKDHKLS DPLATPPLAS GPYRITSWKM GQNIVYSRVK DYWAANLPVN 
RGRWNFDTIR YDYYLDDNVA FEAFKAGAFD LRMENDAKNW ATRYTGKNFD KKYIIKDEQK 
NESAQDTRWL AFNIQRPVFS DRRVREAITL AFDFEWMNKA LFYNAWSRTN SYFQNTEYAA 
RNYPDAAELV LLAPMKKDLP SEVFTQIYQP PVSKGDGYDR DNLLKADKLL NEAGWVLKGQ 
QRVNATTGQP LSFELLLPAS SNSQWVLPFQ HSLQRLGINM DIRKVDNSQI TNRMRSRDYD 
MMPRVWRAMP WPSSDLQISW SSEYINSTYN APGVQSPVID SLINQIIAAQ GNKEKLLPLG 
RALDRVLTWN YYMLPMWYMA EDRLAWWDKF SQPAVRPVYS LGIDTWWYDV NKAAKLPSAR 
QQGE