Gene EcolC_0825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0825
Symbol
ID	6067212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	885658
End bp	886974
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	49%
IMG OID	641600230
Product	guanine deaminase
Protein accession	YP_001723824
Protein GI	170018870
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGGAG AACACACGTT AAAAGCGGTA CGAGGCAGTT TTATTGATGT CACCCGTACG 
GTCGATAACC CGGAAGAGAT TGCCTCTGCG CTGCGGTTTA TTGAGGATGG TTTATTACTC 
ATTAAACAGG GAAAAGTGGA ATGGTTTGGC GAATGGGAAG ACGGAAAGCA TCAAATTCCT 
GACACTATTC GCGTGCGCGA CTATCGCGGC AAACTGATAG TACCGGGCTT TGTCGATACA 
CATATCCATT ATCCGCAAAG TGAAATGGTG GGGGCCTATG GTGAACAATT GCTGGAGTGG 
TTGAATAAAC ACACCTTCCC TACTGAACGT CGTTATGAGG ATTTAGAGTA CGCCCGCGAA 
ATGTCGGCGT TCTTCATCAA GCAGCTTTTA CGTAACGGAA CCACCACGGC GCTGGTGTTT 
GGCACTGTTC ATCCGCAATC CGTTGATGCG CTGTTTGAAG CCGCCAGTCA TATCAATATG 
CGTATGATTG CCGGTAAGGT GATGATGGAC CGCAACGCAC CGGATTATCT GCTAGACACT 
GCCGAAAGCA GCTATCACCA AAGCAAAGAA CTGATCGAAC GCTGGCACAA AAATGGTCGT 
CTGTTGTATG CGATTACGCC ACGCTTCGCC CCTACCTCAT CTCCTGAACA GATGGCGATG 
GCGCAACGCC TGAAAGAAGA ATATCCGGAT ACGTGGGTAC ATACCCATCT CTGTGAAAAC 
AAAGATGAAA TTGCCTGGGT GAAATCGCTT TATCCTGACC ATGATGGTTA TCTGGATGTT 
TACCATCAGT ACGGCCTGAC CGGTAAAAAC TGTGTCTTTG CTCACTGCGT CCATCTCGAA 
GAAAAAGAGT GGGATCGTCT CAGCGAAACC AAATCCAGCA TTGCTTTCTG TCCGACCTCC 
AACCTTTACC TCGGCAGCGG CTTATTCAAC TTGAAAAAAG CATGGCAGAA GAAAGTTAAA 
GTGGGCATGG GAACGGATAT CGGTGCCGGA ACCACTTTCA ACATGCTGCA AACGCTGAAC 
GAAGCCTACA AAGTGTTGCA ATTACAAGGC TATCGCCTCT CGGCATATGA AGCGTTTTAC 
CTGGCCACGC TCGGCGGAGC GAAATCTCTG GGCCTTGACG ATTTGATTGG CAACTTTTTA 
CCTGGCAAAG AGGCTGATTT CGTGGTGATG GAACCCACCG CCACTCCGCT ACAGCAGCTG 
CGCTATGACA ACTCTGTTTC TTTAGTCGAC AAATTGTTCG TGATGATGAC GTTGGGCGAT 
GACCGTTCGA TCTACCGCAC CTACGTTGAT GGTCGTCTGG TGTACGAACG CAACTAA

Protein sequence

MSGEHTLKAV RGSFIDVTRT VDNPEEIASA LRFIEDGLLL IKQGKVEWFG EWEDGKHQIP 
DTIRVRDYRG KLIVPGFVDT HIHYPQSEMV GAYGEQLLEW LNKHTFPTER RYEDLEYARE 
MSAFFIKQLL RNGTTTALVF GTVHPQSVDA LFEAASHINM RMIAGKVMMD RNAPDYLLDT 
AESSYHQSKE LIERWHKNGR LLYAITPRFA PTSSPEQMAM AQRLKEEYPD TWVHTHLCEN 
KDEIAWVKSL YPDHDGYLDV YHQYGLTGKN CVFAHCVHLE EKEWDRLSET KSSIAFCPTS 
NLYLGSGLFN LKKAWQKKVK VGMGTDIGAG TTFNMLQTLN EAYKVLQLQG YRLSAYEAFY 
LATLGGAKSL GLDDLIGNFL PGKEADFVVM EPTATPLQQL RYDNSVSLVD KLFVMMTLGD 
DRSIYRTYVD GRLVYERN