Gene EcE24377A_3640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3640
Symbol
ID	5590500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3638664
End bp	3639659
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	57%
IMG OID	640927263
Product	U32 family peptidase
Protein accession	YP_001464632
Protein GI	157157832
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCTGC TCTGCCCTGC CGGAAATCTC CCGGCGCTTA AGGCGGCCAT CGAAAACGGC 
GCAGATGCTG TTTATATCGG GCTAAAAGAT GATACCAATG CCCGTCACTT CGCCGGCCTT 
AACTTTACCG AGAAAAAATT GCAGGAAGCG GTGAGTTTTG TCCATCAACA TCGCCGCAAA 
CTTCACATCG CGATTAACAC TTTTGCGCAT CCGGACGGTT ACGCCCGTTG GCAGCGTGCC 
GTGGATATGG CGGCGCAGCT GGGTGCCGAC GCGCTGATCC TCGCCGACCT CGCCATGCTA 
GAGTACGCCG CCGAGCGTTA CCCGCATATT GAGCGTCATG TGTCAGTGCA GGCTTCGGCG 
ACCAATGAAG AGGCGATTAA CTTTTATCAT CGCCATTTTG ACGTTGCTCG CGTGGTGCTG 
CCGCGCGTGT TGTCGATTCA TCAGGTGAAA CAACTGGCAC GGGTCACACC TGTACCACTG 
GAAGTCTTTG CTTTCGGCAG CCTGTGCATT ATGTCGGAAG GTCGTTGCTA TCTGTCGTCG 
TATCTGACGG GTGAGTCGCC CAACACCGTA GGCGCGTGTT CTCCGGCCCG TTTCGTGCGC 
TGGCAACAAA CGCCGCAGGG GCTGGAATCC CGCCTGAACG AAGTGCTGAT CGACCGTTAT 
CAGGACGGCG AAAACGCAGG TTATCCGACG CTATGTAAAG GGCGTTATCT GGTGGACGGC 
GAGCGCTATC ACGCGCTGGA AGAACCAACC AGTCTCAATA CCCTGGAACT GCTGCCGGAG 
TTAATGGCGG CGAATATTGC TTCGGTGAAA ATTGAAGGCC GCCAGCGTAG CCCGGCGTAT 
GTCAGCCAGG TGGCGAAAGT CTGGCGTCAG GCTATCGACC GTTGTAAGGC CGATCCGCAA 
AACTTCATAC CGCAAAGCGC GTGGATGGAG ACGCTCGGGT CGATGTCCGA AGGCACGCAG 
ACCACCCTTG GCGCGTATCA CCGTAAATGG CAGTGA

Protein sequence

MELLCPAGNL PALKAAIENG ADAVYIGLKD DTNARHFAGL NFTEKKLQEA VSFVHQHRRK 
LHIAINTFAH PDGYARWQRA VDMAAQLGAD ALILADLAML EYAAERYPHI ERHVSVQASA 
TNEEAINFYH RHFDVARVVL PRVLSIHQVK QLARVTPVPL EVFAFGSLCI MSEGRCYLSS 
YLTGESPNTV GACSPARFVR WQQTPQGLES RLNEVLIDRY QDGENAGYPT LCKGRYLVDG 
ERYHALEEPT SLNTLELLPE LMAANIASVK IEGRQRSPAY VSQVAKVWRQ AIDRCKADPQ 
NFIPQSAWME TLGSMSEGTQ TTLGAYHRKW Q