Gene Caul_1805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1805
Symbol
ID	5899260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1907601
End bp	1908758
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	69%
IMG OID	641562295
Product	aldose 1-epimerase
Protein accession	YP_001683432
Protein GI	167645769
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.122387
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCG AAATAAGCCG TCGCCGCGCC GCGCGCCCTT CCCTGGCCCT GCTGCTGGCC 
GTCGGCCTGA TTTGCGCCAG CGCCGCCTCG GCCCTCGCCG CCGAAGCCAG CCGCGCGCCC 
TACGGCGTGA CGGCGGCCGG CGCGCCGGTC GAGGTCTTCA CCTTGAAGAA CGACCACGGC 
ATGACCGTGA AGGTGCTGTC GTACGGCGGG ATCATCACCC AGGTCGATGT CCCCGACCGC 
AAGGGCGAGG TCAAGAACGT CGTCCTGGAA CTGGCCGACC TGAAGGCCTA CGAGGGCCGG 
GCCAATTTCA GCTCGCTGCT CGGTCGCTAT GCCAACCGGA TCTCGAACGG CGGCTTCACC 
CTGGACGGCG TGCGCCACGA CCTGCCCAGC AGCGCCGACG GCGTCTCCTC GCACGGTGGT 
TCCACGGGCT TTTCCACCCG CCTCTGGACC GGGACGCCCT TCAAGCGCCA TGGCCAGGCG 
GGCGTGACCC TGGCCTACAC CGCCGTCGAT GGCGAAGGCG GCTATCCCGG GACTTTGAAG 
GTCGCCGTGA CCTACACCGT CACCCGCCGC GACGCCCTGC GGATCGACTA CCGCGCCACC 
ACCGACAAGC CGACGGTGAT CAACCTCAGC CATCACGCCT ATTTCAACCT GGCGGGCGCC 
GGCACGGTCC ATGACCAGAC CGCTCAGGTG CTAGCCCAGG CCTTCACCCC GATCAACGCC 
CGCAAGCTGC CGACCGGCGA GGTCGCCCCC GTGGCGGGCA CGGCCCTGGA CCTGCGCCAG 
CCGGCGCGCA TCGGTGATCG GGTCACGGCC GATGACCCGC AGATCAAGCT CGCCAACGGC 
TTCGACCACA ACTTCGTGGT CGACGGCGGC GGACGCGGCA AGCTGGTTCC CGCCGTTCGC 
ATGGCCGACC CGGCCAGCGG GCGCACCCTG GAGGTCGCCA CCACCCAGCC GGGCGTCCAA 
TTGTACGCCG CCAACAGCTT CAACGGCACG CTCAAGACCC CCGATGGACG CCCGCTGGAC 
AGGGGCGCCG GCCTGGCGAT CGAGACCCAG CACTTCGCCG ACAGCCCCAA CCATCCCAAC 
TTCCCCTCGA CCGTCCTGCG GCCCGGGCAG GTGTTCAAGC AAACGACCGA ATTCCGGTTT 
GGGGTGGCGA AACAATAG

Protein sequence

MAVEISRRRA ARPSLALLLA VGLICASAAS ALAAEASRAP YGVTAAGAPV EVFTLKNDHG 
MTVKVLSYGG IITQVDVPDR KGEVKNVVLE LADLKAYEGR ANFSSLLGRY ANRISNGGFT 
LDGVRHDLPS SADGVSSHGG STGFSTRLWT GTPFKRHGQA GVTLAYTAVD GEGGYPGTLK 
VAVTYTVTRR DALRIDYRAT TDKPTVINLS HHAYFNLAGA GTVHDQTAQV LAQAFTPINA 
RKLPTGEVAP VAGTALDLRQ PARIGDRVTA DDPQIKLANG FDHNFVVDGG GRGKLVPAVR 
MADPASGRTL EVATTQPGVQ LYAANSFNGT LKTPDGRPLD RGAGLAIETQ HFADSPNHPN 
FPSTVLRPGQ VFKQTTEFRF GVAKQ