Gene EcHS_A3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3043
Symbol	guaD
ID	5594217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3053283
End bp	3054599
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	49%
IMG OID	640922160
Product	guanine deaminase
Protein accession	YP_001459662
Protein GI	157162344
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGAG AACACACGTT AAAAGCGGTA CGAGGCAGTT TTATTGATGT CACCCGTACG 
GTCGATAACC CGGAAGAGAT TGCCTCTGCG CTGCGGTTTA TTGAGGATGG TTTATTACTC 
ATTAAACAGG GAAAAGTGGA ATGGTTTGGC GAATGGGAAA ACGGAAAGCA TCAAATTCCT 
GACACCATTC GCGTGCGCGA CTATCGCGGC AAACTGATAG TACCGGGCTT TGTCGATACA 
CATATCCATT ATCCGCAAAG TGAAATGGTG GGGGCCTATG GTGAGCAATT GCTGGAGTGG 
TTGAATAAAC ACACCTTCCC TACTGAACGG CGTTATGAGG ATTTAGAGTA CGCCCGCGAA 
ATGTCGGCGT TCTTCATCAA GCAGCTTTTA CGTAACGGAA CCACCACGGC GCTGGTGTTT 
GGCACTGTTC ATCCGCAATC CGTTGATGCG CTGTTTGAAG CCGCCAGTCA TATCAATATG 
CGTATGATTG CCGGTAAGGT GATGATGGAC CGTAACGCAC CGGATTATCT GCTCGACACT 
GCCGAAAGCA GCTATCACCA AAGCAAAGAA CTGATTGAAC GCTGGCACAA AAATGGTCGT 
CTGCTATATG CGATTACGCC ACGCTTCGCC CCGACCTCAT CTCCTGAACA GATGGCGATG 
GCGCAACGCC TGAAAGAAGA ATATCCGGAT ACGTGGGTAC ATACCCATCT CTGTGAAAAC 
AAAGATGAAA TTGCCTGGGT GAAATCGCTT TATCCTGACC ATGATGGTTA TCTGGATGTT 
TACCATCAGT ACGGCCTGAC CGGTAAAAAC TGTGTCTTTG CTCACTGCGT CCATCTCGAA 
GAAAAAGAGT GGGATCGTCT CAGCGAAACC AAATCCAGCA TTGCTTTCTG TCCGACCTCC 
AACCTTTACC TCGGCAGCGG CTTATTCAAC TTGAAAAAAG CATGGCAGAA GAAAGTTAAA 
GTGGGCATGG GAACGGATAT CGGTGCCGGA ACCACTTTCA ACATGCTGCA AACGCTGAAC 
GAAGCCTACA AAGTATTGCA ATTACAAGAC TATCGCCTCT CGGCATATGA AGCGTTTTAC 
CTGGCCACGC TCGGCGGAGC GAAATCTCTG GGCCTTGACG ATTTGATTGG CAACTTTTTA 
CCTGGCAAAG AGGCTGATTT CGTGGTGATG GAACCCACCG CCACTCCGCT ACAGCAGCTG 
CGCTATGACA ACTCTGTTTC TTTAGTCGAC AAATTGTTCG TGATGATGAC GTTGGGCGAT 
GACCGTTCGA TCTACCGCAC CTACGTTGAT GGTCGTCTGG TGTACGAACG CAACTAA

Protein sequence

MSGEHTLKAV RGSFIDVTRT VDNPEEIASA LRFIEDGLLL IKQGKVEWFG EWENGKHQIP 
DTIRVRDYRG KLIVPGFVDT HIHYPQSEMV GAYGEQLLEW LNKHTFPTER RYEDLEYARE 
MSAFFIKQLL RNGTTTALVF GTVHPQSVDA LFEAASHINM RMIAGKVMMD RNAPDYLLDT 
AESSYHQSKE LIERWHKNGR LLYAITPRFA PTSSPEQMAM AQRLKEEYPD TWVHTHLCEN 
KDEIAWVKSL YPDHDGYLDV YHQYGLTGKN CVFAHCVHLE EKEWDRLSET KSSIAFCPTS 
NLYLGSGLFN LKKAWQKKVK VGMGTDIGAG TTFNMLQTLN EAYKVLQLQD YRLSAYEAFY 
LATLGGAKSL GLDDLIGNFL PGKEADFVVM EPTATPLQQL RYDNSVSLVD KLFVMMTLGD 
DRSIYRTYVD GRLVYERN