Gene CPS_4872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4872
Symbol	guaD
ID	3520762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	+
Start bp	5166705
End bp	5168054
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	41%
IMG OID	637287311
Product	guanine deaminase
Protein accession	YP_271511
Protein GI	71280297
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.673098
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAACA ACACTGCAAA CACTTCTTCA ACGAGTGAAG CAATAAGTAA AGCTACAAGT 
ACCGGCCGCA AAGCATATCG TGGCGAAGTA CTACACTTTT TAGCGGATCC TGCCAAAGTA 
TCAGAAGAAG AGAGTTATCA GTACTTTGAA GATGGACTAT TAGTCATCAA CCATGGCTTA 
GTTGAAGCCG TCGGTAACGC CAAGGATTTA CTGAAAACGT TACCCGCCGA CGTTGTCGTT 
ACCCAATATG ACAATGGCCT AATCATGCCT GGTTTTATTG ATACGCATGT ACATTATGCA 
CAATCCGAAA TGGTCGCTTC TTACGGCGAA CAATTACTCG AGTGGTTAGA AAACTATACC 
TTCCCTGAAG AAAAAAAATT TGCTGATCTT GAACACGGTA AACGTGTTGC TGAATTTTTC 
TTAAGCCAAT TATTAGATGC TGGTACCACC ACAGCATTGG TCTTTGGCAC AGTACATAAA 
GAATCTGTTG AAGCTTTTTT TACCGTCGCT CAACAGAAAA AATTACGCAT GATTTGCGGT 
AAAGTGTTGA TGAATCAAAA CTGTCCTGAT GATTTATCAG ATACCGTTGA ATCAGGTTAC 
GCCGACAGTA AAGCGCTCAT TGAAAAATGG CATAACACTG ACAGATTACA ATATGCGGTA 
ACGCCACGTT TTGCACCGAC TTGCTCAACG GAACAACTGA ATAAAGCCGG TGAGTTATTA 
AAAGAATATC CTAGTGTTTA TTTACATACC CATTTATCTG AAAACAAAGA TGAAATTGCA 
TGGGTGAGTG AATTATTCCC TGACAGTGAC GGTTACCTTG ATGTGTACGA TAAAAGCAGT 
CTATTAGGTC GCCGTAGTGT TTTTGCTCAC GGTGTACATT TGCACGATCA TGAGTGTCAG 
CGCTTAAGTG AGACCAATTC AGCCATTGCT TTTTGCCCAA CCTCAAACTT ATTTTTAGGT 
AGCGGTTGTT TCAACTTAAA GCAAGCTGAA GAATTTGATG TGAATGTCGG CTTAGGTACT 
GATATTGGTG CCGGTAGCAG TTTCTCTATG TTAACCACAC TCAACGAAGG TTATAAAACT 
CAGCAATTAC GTGGTGATAA ATTAAGCCCC TACAAATCAT TATATTTAGC GACCTTAGGG 
GGCGCTATTG CCTTAGATTT AGAAGGGACT ATTGGTAACT TTATTCAAGG CGCTGAAGCT 
GACTTTATCG TGCTTGATTA TCAAGCAACA CCTTTAATGG ATGTACGCAT CAAACGCTGT 
ACAACCTTAA CTGAAAAATT ATTCGTGTTG AGCATGCTAG GTGACGATAG ACACGTTAAA 
GCGACGCACA TCATGGGCGA AAAAGTTTAA

Protein sequence

MSNNTANTSS TSEAISKATS TGRKAYRGEV LHFLADPAKV SEEESYQYFE DGLLVINHGL 
VEAVGNAKDL LKTLPADVVV TQYDNGLIMP GFIDTHVHYA QSEMVASYGE QLLEWLENYT 
FPEEKKFADL EHGKRVAEFF LSQLLDAGTT TALVFGTVHK ESVEAFFTVA QQKKLRMICG 
KVLMNQNCPD DLSDTVESGY ADSKALIEKW HNTDRLQYAV TPRFAPTCST EQLNKAGELL 
KEYPSVYLHT HLSENKDEIA WVSELFPDSD GYLDVYDKSS LLGRRSVFAH GVHLHDHECQ 
RLSETNSAIA FCPTSNLFLG SGCFNLKQAE EFDVNVGLGT DIGAGSSFSM LTTLNEGYKT 
QQLRGDKLSP YKSLYLATLG GAIALDLEGT IGNFIQGAEA DFIVLDYQAT PLMDVRIKRC 
TTLTEKLFVL SMLGDDRHVK ATHIMGEKV