Gene Caul_0510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0510
Symbol
ID	5897965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	555434
End bp	556384
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	66%
IMG OID	641560993
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001682142
Protein GI	167644479
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAAA CAGTTTTGGT CTTGGGAGCC ACCGGCGGCG TTGGCCGCCC GATTGCTGGG 
CGGCTGGCCG AGCGAGGCTG GACCGTTCGA GCTCTTCATC GCAACCCCAG CCTTCTGGCG 
ACGTCCGATC CCTTCGATTG GATTCAAGGC GACGCCCTGA ACCCGACCGA TGTCGCGAAG 
GCGGCAAAGG GCGTTTCAAC CATCGTACAC GCGGTGAAAC CTCGGGCGTA CCGCGACTGG 
AAGGACGCGG TCCTGCCGAT GATCGACAAT ACAATCGCGG CGGCCAGGGG CGCGCGCATC 
GTCCTTCCCG GCAATGTTTA CAACTACGGC CCCGACGCCG GCCTGATCCT CGACGAGGAC 
GCGCCGCAGA ATCCGCGCAC GAAGAAGGGC CGCCTTCGCG TGGAGATGGA GGCCCGGATC 
AGCCGCGCCG TGGATGCCGG CTCGGCCAGG GCCCTGATCG TCCGCGCCGG TGATTTTTTC 
GGACCGGGCG CGGGCAGTAG CTGGTTCAGC GAAGCCATGG TCAAGCCCGG CGGGCGCCCG 
CGCGTCGTCC GCAATCCGGC CACACTGGGG GTCGGCCACC AGTGGGTCTT TCTGCCGGAT 
CTGGCGGAAA CCTTTGCACG ATTAATCGAC CGCGACGATC TGCCCAACTT GGCCCGCTAC 
AATATGGACG GGCATTGGGA TGCGGACGGG CGTGAGATGG CGGCCGCGAT CGTGCGGGCG 
CTGGGCGAAC CCGCCGTACC CGTCAAACCC CTGCCGTGGG GGCTATTGAC GCTTGTCGCT 
CCGTTCTCGC CCAATCTTAG GGAACTGGTC GAGCTGAGGT CGCTGTGGGA CACCCCGATC 
CGTCTGTCCA ACCGACGGCT GGTCGAGGTC CTGGGCGAGG AGCCCCATAC GCCTCTGGAC 
GAGGCGGTCC GCCAGACGCT GGCCTTCCTT CAGTCCGTTC CGGAATCATA G

Protein sequence

MPKTVLVLGA TGGVGRPIAG RLAERGWTVR ALHRNPSLLA TSDPFDWIQG DALNPTDVAK 
AAKGVSTIVH AVKPRAYRDW KDAVLPMIDN TIAAARGARI VLPGNVYNYG PDAGLILDED 
APQNPRTKKG RLRVEMEARI SRAVDAGSAR ALIVRAGDFF GPGAGSSWFS EAMVKPGGRP 
RVVRNPATLG VGHQWVFLPD LAETFARLID RDDLPNLARY NMDGHWDADG REMAAAIVRA 
LGEPAVPVKP LPWGLLTLVA PFSPNLRELV ELRSLWDTPI RLSNRRLVEV LGEEPHTPLD 
EAVRQTLAFL QSVPES