Gene EcolC_4224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4224
Symbol
ID	6067819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4665755
End bp	4667239
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	54%
IMG OID	641603656
Product	guanosine pentaphosphate phosphohydrolase
Protein accession	YP_001727148
Protein GI	170022194
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.133689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTCCA CCTCGTCGCT GTATGCAGCC ATTGATCTCG GTTCGAATAG TTTTCATATG 
CTGGTTGTGC GCGAGGTGGC TGGAAGCATC CAGACGCTGA CGCGAATAAA ACGCAAAGTG 
CGTCTGGCTG CTGGCCTGAA TAGCGAAAAT GCCCTCTCCA ATGAAGCAAT GGAGCGCGGT 
TGGCAATGTT TGCGCCTGTT TGCTGAACGT CTGCAAGATA TTCCTCCCTC GCAAATTCGC 
GTTGTCGCTA CGGCGACGTT ACGCCTTGCC GTCAATGCGG GTGATTTTAT TGCCAAAGCG 
CAGGAAATTC TCGGTTGTCC GGTACAGGTG ATCAGCGGTG AAGAGGAAGC ACGTCTGATT 
TATCAGGGCG TTGCTCACAC CACTGGTGGT GCCGATCAGC GCCTGGTGGT GGATATAGGC 
GGAGCCAGTA CTGAACTGGT AACCGGCACG GGTGCACAAA CCACCTCGTT GTTCAGCCTG 
TCGATGGGCT GCGTCACTTG GCTGGAACGC TATTTTGCCG ATCGTAATCT GGGGCAGGAA 
AATTTTGATG CTGCAGAAAA AGCGGCACGC GAAGTGTTAC GTCCGGTTGC CGATGAATTA 
CGGTATCACG GCTGGAAAGT GTGCGTTGGT GCTTCCGGCA CCGTGCAGGC GTTACAGGAA 
ATCATGATGG CACAGGGGAT GGATGAACGC ATTACCCTGG AAAAGTTGCA GCAATTGAAA 
CAGCGAGCCA TTCATTGCGG TCGGCTGGAG GAACTGGAGA TTGACGGGCT GACGCTGGAA 
CGTGCGTTAG TGTTCCCGAG TGGTCTGGCG ATCCTGATCG CCATTTTTAC CGAACTGAAT 
ATTCAGTGTA TGACCCTGGC GGGCGGTGCG CTGCGTGAAG GCCTGGTCTA CGGCATGTTG 
CATCTGGCCG TCGAGCAGGA TATTCGCAGC CGTACGCTGC GTAATATTCA ACGCCGCTTT 
ATGATCGATA TTGATCAGGC ACAGCGCGTA GCCAAAGTTG CGGCTAACTT CTTCGATCAG 
GTGGAAAACG AATGGCATCT TGAAGCAATA AGCCGCGATT TGCTCATCAG CGCCTGTCAG 
CTTCATGAAA TCGGCCTGAG CGTTGACTTC AAACAAGCGC CGCAACACGC TGCTTATCTG 
GTGCGTAATC TGGATCTTCC CGGTTTTACC CCCGCACAGA AAAAATTGCT GGCGACGCTA 
CTGCTCAACC AGACTAATCC GGTCGATCTC TCATCGCTGC ATCAGCAAAA TGCCGTACCG 
CCGCGCGTCG CAGAACAACT CTGCCGTTTA CTACGCCTGG CCATCATTTT TGCCAGCCGT 
CGCCGTGACG ATCTCGTGCC AGAGATGACA TTACAGGCTA ACCATGAACT GTTGACCTTG 
ACGCTTCCGC AAGGTTGGCT AACCCAACAT CCGCTGGGTA AAGAGATTAT TGCTCAGGAA 
AGCCAGTGGC AGAGCTATGT CCACTGGCCG CTGGAAGTGC ATTAA

Protein sequence

MGSTSSLYAA IDLGSNSFHM LVVREVAGSI QTLTRIKRKV RLAAGLNSEN ALSNEAMERG 
WQCLRLFAER LQDIPPSQIR VVATATLRLA VNAGDFIAKA QEILGCPVQV ISGEEEARLI 
YQGVAHTTGG ADQRLVVDIG GASTELVTGT GAQTTSLFSL SMGCVTWLER YFADRNLGQE 
NFDAAEKAAR EVLRPVADEL RYHGWKVCVG ASGTVQALQE IMMAQGMDER ITLEKLQQLK 
QRAIHCGRLE ELEIDGLTLE RALVFPSGLA ILIAIFTELN IQCMTLAGGA LREGLVYGML 
HLAVEQDIRS RTLRNIQRRF MIDIDQAQRV AKVAANFFDQ VENEWHLEAI SRDLLISACQ 
LHEIGLSVDF KQAPQHAAYL VRNLDLPGFT PAQKKLLATL LLNQTNPVDL SSLHQQNAVP 
PRVAEQLCRL LRLAIIFASR RRDDLVPEMT LQANHELLTL TLPQGWLTQH PLGKEIIAQE 
SQWQSYVHWP LEVH