Gene EcE24377A_3209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3209
Symbol	guaD
ID	5590714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3229231
End bp	3230547
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	49%
IMG OID	640926849
Product	guanine deaminase
Protein accession	YP_001464221
Protein GI	157155291
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGAG AACACACGTT GAAAGCGGTA CGAGGCAGTT TTATTGATGT CACCCGTACG 
GTCGATAACC CGGAAGAGAT TGCCTCTGCG CTGCGGTTTA TTGAGGATGG TTTATTACTC 
ATTAAACAGG GAAAAGTGGA ATGGTTTGGC GAATGGGAAG ACGGAAAGCA TCAAATTCCT 
GACACTATTC GCGTGCGCGA CTATCGCGGC AAACTGATAG TACCGGGCTT TGTCGATACA 
CATATCCATT ATCCGCAAAG TGAAATGGTG GGGGCCTATG GTGAACAATT GCTGGAGTGG 
TTGAATAAAC ACACCTTCCC TACTGAACGT CGTTATGAGG ATTTAGAGTA CGCCCGCGAA 
ATGTCGGCAT TCTTCATCAA GCAGCTTTTA CGTAACGGAA CCACCACGGC GCTGGTGTTT 
GGCACTGTTC ATCCGCAATC TGTTGATGCG CTGTTTGAAG CCGCCAGTCA TATCAATATG 
CGTATGATTG CCGGTAAGGT GATGATGGAC CGCAACGCAC CGGATTATCT GCTCGACACT 
GCCGAAAGCA GCTATCACCA AAGCAAAGAA CTGATTGAAC GCTGGCACAA AAATGGTCGT 
CTGCTATATG CGATTACGCC ACGCTTCGCC CCGACCTCAT CTCCTGAACA GATGGCGATG 
GCGCAACGCC TGAAAGAAGA ATATCCGGAT ACGTGGGTAC ATACCCATCT CTGTGAAAAC 
AAAGATGAAA TTGCCTGGGT GAAATCGCTT TATCCTGACC ATGATGGTTA TCTGGATGTT 
TACCATCAGT ACGGCCTGAC CGGTAAAAAC TGTGTCTTTG CTCACTGCGT CCATCTCGAA 
GAAAAAGAGT GGGATCGTCT CAGCGAAACC AAATCCAGCA TTGCTTTCTG TCCGACCTCC 
AACCTTTACC TCGGCAGCGG CTTATTCAAC TTGAAAAAAG CATGGCAGAA GAAAGTTAAA 
GTGGGCATGG GAACGGATAT CGGTGCCGGA ACCACTTTCA ACATGCTGCA AACGCTGAAC 
GAAGCCTACA AAGTATTGCA ATTACAAGGC TATCGCCTCT CGGCATATGA AGCGTTTTAC 
CTGGCCACGC TCGGCGGAGC GAAATCTCTG GGCCTTGACG ATTTGATTGG CAACTTTTTA 
CCTGGCAAAG AGGCTGATTT CGTGGTGATG GAACCCACCG CCACTCCGCT ACAGCAGCTG 
CGCTATGACA ACTCTGTTTC TTTAGTCGAC AAATTGTTCG TGATGATGAC GTTGGGCGAT 
GACCGTTCGA TCTACCGCAC CTACGTTGAT GGTCGTCTGG TGTACGAACG CAACTAA

Protein sequence

MSGEHTLKAV RGSFIDVTRT VDNPEEIASA LRFIEDGLLL IKQGKVEWFG EWEDGKHQIP 
DTIRVRDYRG KLIVPGFVDT HIHYPQSEMV GAYGEQLLEW LNKHTFPTER RYEDLEYARE 
MSAFFIKQLL RNGTTTALVF GTVHPQSVDA LFEAASHINM RMIAGKVMMD RNAPDYLLDT 
AESSYHQSKE LIERWHKNGR LLYAITPRFA PTSSPEQMAM AQRLKEEYPD TWVHTHLCEN 
KDEIAWVKSL YPDHDGYLDV YHQYGLTGKN CVFAHCVHLE EKEWDRLSET KSSIAFCPTS 
NLYLGSGLFN LKKAWQKKVK VGMGTDIGAG TTFNMLQTLN EAYKVLQLQG YRLSAYEAFY 
LATLGGAKSL GLDDLIGNFL PGKEADFVVM EPTATPLQQL RYDNSVSLVD KLFVMMTLGD 
DRSIYRTYVD GRLVYERN