Gene Caul_3124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3124
Symbol
ID	5900579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3388378
End bp	3389562
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	67%
IMG OID	641563627
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_001684749
Protein GI	167647086
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.126416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.177037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGT CTCCGTTCTT CGTTCCGCGC GCGCCCTATG CCGAGGATCC GGCCAAGTCC 
CGGGGCCGTC GCTTCCCGGA AGACGAGAGC CGCACGCGCA CCCCGTTCGC CCGCGATCGC 
GACCGCATCA TCCACACCTC GGCCTTCCGA CGGCTCAAGG AAAAGACCCA GGTGTTCGTC 
GCCCACGAGG GCGACAACTT CCGCACCCGC CTGACCCATT CGCTGGAGGT GGCGCAAGTG 
GCGCGCTCGC TGGCGACCGC GTTGGGGTTG GACAGCGACC TAGCCGAGAC CATCGCCTTG 
GGCCACGACA TCGGCCATCC GCCGTTCGGC CACGCGGGCG AGGACGAGCT ACAGGCCTGC 
ATGAAGGCGT TCGGCGGCTT CGACCACAAC GTCCAGACCT TCCGCGTCGT CACCGAGCTG 
GAGCGCCGCT ATCCCGACTT CGACGGCCTG AACCTGACCT GGGAAACGCT GGAAGGCATC 
ATCAAGCACA ACGGGCCGGT GACCGAGAAA CTGGGCAAGC CGTCGTGGAA GGCGATCTCC 
AAGTACGACG CCGAATACAA GCTGGGCCTC AACACCTGGG CTTCGGCCGA GGCGCAGGTC 
GCGGCCCTGG CCGACGACAT CGCCTACAAC AACCACGACG TCGATGACGG GGTCGAGGCG 
GGGTTGTTCA CCCTGGACGA GTTGATGGAC GTGCCGCTGA TCGGCCCGAT CCTGGCCGCC 
GTGCGCAGCG AACGCCCGGA CCTGGACCTG CGGCTGACGC GCCTGGAAGC CGTGCGTCGG 
ATGATCGGCG CCATGGTCGA CGACGTGATG GGCGAGACTT TGAAGCGCGC GGCCGCCACC 
GGCGTGCAGT CGGCCGAGGA CGTCCGCAAC CTTGACCACG CCCTGGTCGC TTTCTCGGCG 
GACATGGCCG AGGATCTTGC CCGTCTGCGC CAGTTCCTGC ACACCCGGAT GTACCGTCAC 
TGGAAGGTCA ATCGCACGCG CAGCCAGGCG CGCCGCATTC TGGCCGAGAT GTTCGGTCTG 
TTCTTGGCGG AACCCGACGT CCTGCCGTCG GAATGGTTCG CCCGGTCGCA GAATCGCGAC 
GAGGCCGGCC GCGCTCGCGT GGTCTGCGAC TACATCGCGG GCATGACCGA CCGTTTCGCC 
ATCGAAGAGC ACCGCAAGCT GTTCCAGCTC GACGTCTGGA ACTGA

Protein sequence

MSSSPFFVPR APYAEDPAKS RGRRFPEDES RTRTPFARDR DRIIHTSAFR RLKEKTQVFV 
AHEGDNFRTR LTHSLEVAQV ARSLATALGL DSDLAETIAL GHDIGHPPFG HAGEDELQAC 
MKAFGGFDHN VQTFRVVTEL ERRYPDFDGL NLTWETLEGI IKHNGPVTEK LGKPSWKAIS 
KYDAEYKLGL NTWASAEAQV AALADDIAYN NHDVDDGVEA GLFTLDELMD VPLIGPILAA 
VRSERPDLDL RLTRLEAVRR MIGAMVDDVM GETLKRAAAT GVQSAEDVRN LDHALVAFSA 
DMAEDLARLR QFLHTRMYRH WKVNRTRSQA RRILAEMFGL FLAEPDVLPS EWFARSQNRD 
EAGRARVVCD YIAGMTDRFA IEEHRKLFQL DVWN