Gene EcolC_0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0171
Symbol
ID	6068251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	186949
End bp	188556
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	52%
IMG OID	641599573
Product	4-phytase
Protein accession	YP_001723180
Protein GI	170018226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTT CCTTGAAAAA GTCAGGGATG CTGAAGCTTG GTCTCAGCCT GGTGGCTATG 
ACCGTCGCAG CAAGTGTTCA GGCTAAAACT CTGGTTTATT GCTCAGAAGG ATCTCCGGAA 
GGGTTTAACC CGCAGCTGTT TACCTCCGGC ACCACCTATG ACGCCTCTTC CGTCCCGCTT 
TATAACCGTC TGGTTGAATT TAAAATCGGC ACCACCGAAG TGATCCCGGG CCTCGCTGAA 
AAGTGGGAAG TCAGCGAAGA CGGTAAAACC TATACCTTCC ATCTGCGTAA AGGTGTGAAG 
TGGCACGACA ATAAAGAATT CAAACCGACG CGTGAACTGA ACGCCGATGA TGTGGTGTTC 
TCGTTCGATC GTCAGAAAAA CGCGCAAAAC CCGTACCATA AAGTTTCTGG CGGCAGCTAC 
GAATACTTCG AAGGCATGGG CTTGCCAGAG CTGATCAGTG AAGTGAAAAA GGTGGACGAC 
AACACCGTTC AGTTTGTGCT GACTCGCCCG GAAGCGCCGT TCCTCGCTGA CCTGGCAATG 
GACTTCGCCT CTATTCTGTC AAAAGAATAT GCTGATGCGA TGATGAAAGC CGGTACACCG 
GAAAAACTGG ACCTCAACCC AATCGGAACC GGTCCGTTCC AGTTACAGCA GTATCAAAAA 
GATTCCCGTA TCCGCTACAA AGCGTTTGAT GGCTACTGGG GCACCAAACC GCAGATCGAT 
ACGCTGGTTT TCTCTATTAC CCCTGACGCT TCCGTGCGTT ACGCGAAATT GCAGAAGAAT 
GAATGCCAGG TGATGCCGTA CCCGAACCCG GCAGATATCG CTCGCATGAA GCAGGATAAA 
TCCATCAATC TGATGGAAAT GCCGGGGCTG AACGTCGGTT ATCTCTCGTA TAACGTGCAG 
AAAAAACCAC TCGATGACGT GAAAGTTCGC CAGGCTCTGA CCTACGCGGT GAACAAAGAC 
GCGATCATCA AAGCGGTTTA TCAGGGCGCG GGCGTATCAG CGAAAAACCT GATCCCGCCA 
ACCATGTGGG GCTATAACGA CGACGTTCAG GACTACACCT ACGATCCTGA AAAAGCGAAA 
GCCTTGCTGA AAGAAGCGGG TCTGGAAAAA GGTTTCTCCA TCGACCTGTG GGCGATGCCG 
GTACAACGTC CGTATAACCC GAACGCTCGC CGCATGGCGG AGATGATTCA GGCAGACTGG 
GCGAAAGTCG GCGTGCAGGC CAAAATTGTC ACCTACGAAT GGGGTGAGTA CCTCAAGCGT 
GCGAAAGATG GCGAGCACCA GACGGTAATG ATGGGCTGGA CTGGCGATAA CGGGGATCCG 
GATAACTTCT TCGCCACCCT GTTCAGCTGC GCCGCCTCTG AACAAGGCTC CAACTACTCA 
AAATGGTGCT ACAAACCGTT TGAAGATCTG ATTCAACCGG CGCGTGCTAC CGACGACCAC 
AATAAACGCG TTGAACTGTA CAAACAAGCG CAGGTGGTGA TGCACGATCA GGCTCCGGCA 
CTGATCATCG CTCACTCCAC CGTGTTTGAA CCGGTACGTA AAGAAGTTAA AGGCTATGTG 
GTTGATCCAT TAGGCAAACA TCACTTCGAA AACGTCTCTA TCGAATAA

Protein sequence

MRISLKKSGM LKLGLSLVAM TVAASVQAKT LVYCSEGSPE GFNPQLFTSG TTYDASSVPL 
YNRLVEFKIG TTEVIPGLAE KWEVSEDGKT YTFHLRKGVK WHDNKEFKPT RELNADDVVF 
SFDRQKNAQN PYHKVSGGSY EYFEGMGLPE LISEVKKVDD NTVQFVLTRP EAPFLADLAM 
DFASILSKEY ADAMMKAGTP EKLDLNPIGT GPFQLQQYQK DSRIRYKAFD GYWGTKPQID 
TLVFSITPDA SVRYAKLQKN ECQVMPYPNP ADIARMKQDK SINLMEMPGL NVGYLSYNVQ 
KKPLDDVKVR QALTYAVNKD AIIKAVYQGA GVSAKNLIPP TMWGYNDDVQ DYTYDPEKAK 
ALLKEAGLEK GFSIDLWAMP VQRPYNPNAR RMAEMIQADW AKVGVQAKIV TYEWGEYLKR 
AKDGEHQTVM MGWTGDNGDP DNFFATLFSC AASEQGSNYS KWCYKPFEDL IQPARATDDH 
NKRVELYKQA QVVMHDQAPA LIIAHSTVFE PVRKEVKGYV VDPLGKHHFE NVSIE