Gene EcolC_1560 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1560
Symbol
ID	6066531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1726076
End bp	1727437
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	54%
IMG OID	641600976
Product	peptidase U32
Protein accession	YP_001724546
Protein GI	170019592
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.657213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.902837
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAC CGGAACTCCT TTCCCCGGCG GGAACGCTGA AAAATATGCG TTACGCTTTC 
GCTTATGGCG CAGATGCTGT TTATGCGGGC CAGCCGCGTT ACTCCCTGCG TGTGCGCAAC 
AACGAATTCA ACCACGAAAA TCTTCAGCTC GGCATCAATG AAGCCCACGC GCTGGGGAAA 
AAGTTTTATG TCGTGGTCAA CATTGCACCG CACAACGCCA AGCTGAAAAC CTTTATCCGT 
GACCTGAAAC CGGTGGTGGA AATGGGGCCG GATGCGCTGA TTATGTCCGA TCCAGGGCTG 
ATTATGCTGG TGCGTGAGCA CTTCCCTGAA ATGCCGATCC ACCTCTCGGT GCAGGCTAAC 
GCCGTAAACT GGGCGACGGT GAAATTCTGG CAGCAAATGG GCCTGACCCG CGTGATCCTC 
TCTCGCGAGC TGTCGCTGGA AGAGATTGAA GAGATCCGCA ATCAGGTGCC GGATATGGAG 
ATCGAGATCT TCGTTCACGG CGCACTGTGC ATGGCCTACT CCGGTCGCTG CCTGCTCTCT 
GGCTATATCA ACAAGCGCGA TCCGAACCAG GGTACCTGCA CCAACGCCTG CCGCTGGGAG 
TACAACGTCC AGGAAGGGAA AGAAGATGAC GTTGGCAACA TCGTACACAA GTACGAGCCG 
ATTCCGGTGC AAAATGTTGA GCCGACGCTG GGTATCGGCG CGCCAACCGA CAAAGTGTTT 
ATGATCGAAG AAGCCCAGCG TCCGGGCGAG TATATGACCG CGTTTGAAGA TGAGCACGGC 
ACTTACATCA TGAACTCGAA AGATCTGCGC GCCATCGCCC ATGTAGAACG CCTGACCAAA 
ATGGGCGTGC ATTCGCTGAA AATCGAAGGC CGTACTAAAT CTTTCTACTA TTGCGCACGC 
ACCGCACAGG TTTACCGTAA AGCTATCGAT GACGCCGCTG CGGGCAAACC GTTCGATACC 
AGCCTGCTGG AAACTCTGGA AGGTCTGGCG CATCGTGGCT ATACCGAAGG TTTCCTGCGT 
CGTCATACTC ACGACGATTA TCAGAACTAC GAATACGGTT ATTCAGTTTC TGACCGCCAG 
CAGTTTGTTG GTGAGTTTAC CGGTGAGCGC AAGGGGGACC TCGCGGCGGT AGCGGTGAAA 
AATAAATTCT CCGTTGGCGA CAGCCTTGAG CTGATGACGC CGCAAGGCAA CATTAACTTT 
ACCCTTGAGC ACATGGAAAA CGCCAAAGGT GAAGCGATGC CGGTCGCACC AGGCGATGGT 
TATACTGTGT GGCTCCCGGT CCCGCAGGAT CTTGAGCTCA ATTACGCTCT GCTGATGCGT 
AATTTCTCCG GGGAAACCAC GCGTAACCCA CACGGTAAGT GA

Protein sequence

MFKPELLSPA GTLKNMRYAF AYGADAVYAG QPRYSLRVRN NEFNHENLQL GINEAHALGK 
KFYVVVNIAP HNAKLKTFIR DLKPVVEMGP DALIMSDPGL IMLVREHFPE MPIHLSVQAN 
AVNWATVKFW QQMGLTRVIL SRELSLEEIE EIRNQVPDME IEIFVHGALC MAYSGRCLLS 
GYINKRDPNQ GTCTNACRWE YNVQEGKEDD VGNIVHKYEP IPVQNVEPTL GIGAPTDKVF 
MIEEAQRPGE YMTAFEDEHG TYIMNSKDLR AIAHVERLTK MGVHSLKIEG RTKSFYYCAR 
TAQVYRKAID DAAAGKPFDT SLLETLEGLA HRGYTEGFLR RHTHDDYQNY EYGYSVSDRQ 
QFVGEFTGER KGDLAAVAVK NKFSVGDSLE LMTPQGNINF TLEHMENAKG EAMPVAPGDG 
YTVWLPVPQD LELNYALLMR NFSGETTRNP HGK