Gene ECH74115_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4005
Symbol	iap
ID	6972209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3701501
End bp	3702538
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	49%
IMG OID	643387773
Product	alkaline phosphatase isozyme conversion aminopeptidase
Protein accession	YP_002272216
Protein GI	209395718
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCCG CATTGCGCCA CCGTACCGCT GCCCTGGCGC TCGGCGTATG CTTTATTCTC 
CCCGTACACG CCTCGTCACC TAAACCTGGC GATTTTGCCA ATACACAGGC GCGACATATT 
GCCACTTTCT TTCCGGGACG AATGACCGGA ACACCCGCAG AAATGTTATC TGCCGATTAT 
ATTCGGCAAC AGTTTCAGCA AATGGGTTAC CGCAGTGATA TTCGTACGTT TAATAGCCGA 
TATATTTATA CCGCCCGCGA TAACCGCAAA AACTGGCACA ACGTGACGGG AAGTACGGTG 
ATTGCCGCTC ATGAAGGCAA AGCGCCGCAG CAGATCATTA TTATGGCGCA TCTGGATACC 
TATGCCCCGC AGAGCGACGC AGATGCAGAT GCCAATCTCG GCGGGCTGAC GTTACAAGGA 
ATGGATGATA ACGCCGCAGG TTTAGGTGTC ATGCTGGAAC TGGCAGAACG CCTGAAAAAT 
ACGCCTACCG AGTATGGTAT TCGATTTGTG GCGACCAGTG GAGAAGAGGA AGGGAAATTA 
GGCGCTGAGA ATTTACTCAA GCGGATGAGT GACACCGAAA AGAAAAATAC GCTGCTGGTG 
ATTAATCTCG ATAACTTAAT TGTTGGCGAT AAATTGTATT TCAACAGCGG TGTAAAAACC 
CCTGAAGCAG TAAGGAAATT AACGCGCGAC AGGGCGCTGG CAATTGCGCG TAGTCATGGA 
ATTGCCGCAA CGACCAATCC GGGTTTGAAT AAAAATTATC CGAAAGGCAC TGGATGTTGT 
AATGACGCAG AAATATTCGA CAAAGCGGGC ATTGCTGTAC TTTCGGTGGA AGCGACAAAC 
TGGAATCTTG GGAATAAAGA TGGTTATCAG CAACGCGCAA AAACAGCCGC ATTCCCTGCG 
GGAAATAGCT GGCATGACGT AAGACTGGAT AATCAGCAAC ATATTGATAA AGCACTTCCT 
GGAAGAATAG AACGTCGCTG CCGTGACGTT ATGCGGATAA TGCTACCGCT GGTGAAGGAG 
TTGGCGAAGG CGTCTTGA

Protein sequence

MFSALRHRTA ALALGVCFIL PVHASSPKPG DFANTQARHI ATFFPGRMTG TPAEMLSADY 
IRQQFQQMGY RSDIRTFNSR YIYTARDNRK NWHNVTGSTV IAAHEGKAPQ QIIIMAHLDT 
YAPQSDADAD ANLGGLTLQG MDDNAAGLGV MLELAERLKN TPTEYGIRFV ATSGEEEGKL 
GAENLLKRMS DTEKKNTLLV INLDNLIVGD KLYFNSGVKT PEAVRKLTRD RALAIARSHG 
IAATTNPGLN KNYPKGTGCC NDAEIFDKAG IAVLSVEATN WNLGNKDGYQ QRAKTAAFPA 
GNSWHDVRLD NQQHIDKALP GRIERRCRDV MRIMLPLVKE LAKAS