Gene EcE24377A_1977 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1977
Symbol
ID	5587655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1961695
End bp	1962861
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	56%
IMG OID	640925649
Product	putative ABC transporter solute-binding protein
Protein accession	YP_001463052
Protein GI	157155445
COG category	[R] General function prediction only
COG ID	[COG4134] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.942474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCATT GTGGGTGGTT GCTGGGATTG TTATCGCTGT TTTCTTTGGC AACACATGCC 
AGTGACTGGC AGGAAATTAA AAATGAGGCC AAAGGGCAAA CCGTCTGGTT TAACGCCTGG 
GGCGGCGATA CCGCAATTAA CCGCTATCTC GACTGGGTTA GCGGCGAGAT GAAAACCCAT 
TACGCTATAA ACCTGAAGAT TGTTCGTCTC GCGGATGCCG CAGACGCGGT GAAGCGCATT 
CAGACCGAAG CTGCTGCCGG ACGTAAAACG GGCGGCTCGG TGGATCTGCT CTGGGTGAAC 
GGCGAAAACT TCCGCACCTT AAAAGAGGCC AATTTATTAC AAACGGGCTG GGCGGAGACT 
CTGCCCAACT GGCGCTATGT CGACACACAG CTGCCGGTGC GGGAAGATTT TTCAGTGCCG 
ACACAAGGTG CGGAATCGCC CTGGGGCGGC GCACAACTGA CGTTTATCGC CCGCCGCGAT 
GTTACGCCAC AGCCACCACA AACGCCGCAA GCCTTACTGG AGTTTGCTAA AGTCAATCCC 
GGCACGGTTA CCTATCCGCG CCCACCGGAC TTTACCGGCA CGGCGTTTCT TGAACAGTTG 
CTGATTATGC TGACGCCAGA TCCCGCCGCA TTAAAAGAAG CGCCGGACGA TGCGACTTTC 
GCCCGTGTCA CTGCTCCCTT GTGGCAATAT CTTGATGCGC TACATCCGTA TTTGTGGCGC 
GAAGGAAAGG ATTTCCCGCC TTCGCCCGCG CGGATGGATG CTCTGCTGAA AGCCGGCACA 
TTGCGCCTGT CGCTGACCTT TAGCCCCGCG CATGCGCAGC AAAAAATCGC CAGCGGCGAT 
TTGCCGGCAA GCAGTTACAG TTTTGGCTTT CGCGAGGGGA TGATAGGCAA CGTGCATTTC 
GTCACCATTC CAGCCAACGC GAATGCCAGT GCTGCGGCGA AGGTAGTTGC CAATTTCCTG 
CTCTCACCCG ATGCGCAACT GCGTAAAGCA GATCCCGTTG TCTGGGGCGA TCCTTCTGTT 
CTCGATCCGC AAAAACTGCC TGACGGGCAG CGCGAAATAT TGCAATCAAG AATGCCGCAG 
GATCTGCCGC CGGTACTGGC TGAACCGCAC GCAGGATGGG TGAATGCACT GGAACAAGAA 
TGGTTACGCC GTTACGGTAC GCATTAA

Protein sequence

MRHCGWLLGL LSLFSLATHA SDWQEIKNEA KGQTVWFNAW GGDTAINRYL DWVSGEMKTH 
YAINLKIVRL ADAADAVKRI QTEAAAGRKT GGSVDLLWVN GENFRTLKEA NLLQTGWAET 
LPNWRYVDTQ LPVREDFSVP TQGAESPWGG AQLTFIARRD VTPQPPQTPQ ALLEFAKVNP 
GTVTYPRPPD FTGTAFLEQL LIMLTPDPAA LKEAPDDATF ARVTAPLWQY LDALHPYLWR 
EGKDFPPSPA RMDALLKAGT LRLSLTFSPA HAQQKIASGD LPASSYSFGF REGMIGNVHF 
VTIPANANAS AAAKVVANFL LSPDAQLRKA DPVVWGDPSV LDPQKLPDGQ REILQSRMPQ 
DLPPVLAEPH AGWVNALEQE WLRRYGTH