Gene Caul_0825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0825
Symbol
ID	5898280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	884888
End bp	886105
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	71%
IMG OID	641561306
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001682454
Protein GI	167644791
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATGC CCCAGCTCGC CCTCGCGGTT CTCGTCCTGA CGGCCTGCGG CCCCACCGGC 
CAGGTCCAGG CCCAGCCCCA TCCGCCGGTC GAGACGGCGC CGCCCAACGC CGCGGGCCAG 
ACGCCGGCCT TCCCGCAGCA GACCCGCGCG CCCGAGGAAA AGCTGGGCGT GGCCTACAAG 
GTCGAGACCC TGGCCACCGG TCTGGAACAC CCCTGGAGCC TGGCCTTCCT GCCCGACGGT 
TCGAAGTTGG TGAGCGAGCG GGCCGGCCGG CTGCGGATTC TGGGCGCCGA CGGCAAACTG 
TCGCCGGCCG TCACCGGCCT GCCGGCGGTC TACGCCGAGG GCCAGGGCGG GTTGTTCGAC 
GTGGCGCTGG ACCCCGACTA CGCCAGGAAC GGCCTGATCT ACTGGACCTA TGCCGAGCCG 
CGCGAGGGCG GCAACGGCAC GACGGCGGCG CGCGGCAAGC TGGTGCTCGG CGCCGCGCCC 
AGGGTCGAGA CCGTCCAGGT GATCTGGCGG CAAACGCCGA CCATGGACTC GCCCCTGCAT 
TTTGGCGGCC GCCTGGCCTT CGCCCGCGAC GGATCGCTGT TCATCACCAC GGGCGAGCGC 
TCGATCATCC CCGGCCGGAT GCAGGCCCAG AAACTGGACG CCGCCCTGGG CAAGGTCATC 
CGCATACGGC CGGATGGCGC GATCCCGGCC GACAATCCGT TCGTCGGCGA TCCCCAGGCC 
AAGCCGGAGA TCTGGTCCAG GGGCCACCGC AACGTCCAGG GCGCGACGAT CAATCCGTGG 
ACCGGCCAGC TATGGACCGC CGAGCACGGC GCCCGGGGCG GCGACGAGAT CAACACCCCC 
AAGGCCGGCA AGGATTATGG CTGGCCGACC ATCACCTATG GCGAGGAATA TTCCGGCAAG 
CCGGTCGGCG ACGGGATCAC CCAGCACGAG GGCATGGAGC AGCCGGTCTA TTACTGGGAC 
CCGGTGATCG CCCCCTCGGG CCTGGCCTTC TACAACGCCA GCCTGTTCCC GGCCTGGAAG 
GGCAGCCTGT TCGTCGGCGG GCTCAAGGGC TACCTCGTGC GCCTGACGCT CAAGGACGAC 
AAGGTGGTGG GCGAGGAGCG GCTGCTCTCG GAGCTCGACT CGCGGATTCG CGACGTGCGG 
GTGGGTCCCG ACGGCGCGGT CTATGTGGTG ACCGACGAGG ACGACGGGCG GGTGCTGCGG 
CTGACGCCGA AGGGGTAG

Protein sequence

MRMPQLALAV LVLTACGPTG QVQAQPHPPV ETAPPNAAGQ TPAFPQQTRA PEEKLGVAYK 
VETLATGLEH PWSLAFLPDG SKLVSERAGR LRILGADGKL SPAVTGLPAV YAEGQGGLFD 
VALDPDYARN GLIYWTYAEP REGGNGTTAA RGKLVLGAAP RVETVQVIWR QTPTMDSPLH 
FGGRLAFARD GSLFITTGER SIIPGRMQAQ KLDAALGKVI RIRPDGAIPA DNPFVGDPQA 
KPEIWSRGHR NVQGATINPW TGQLWTAEHG ARGGDEINTP KAGKDYGWPT ITYGEEYSGK 
PVGDGITQHE GMEQPVYYWD PVIAPSGLAF YNASLFPAWK GSLFVGGLKG YLVRLTLKDD 
KVVGEERLLS ELDSRIRDVR VGPDGAVYVV TDEDDGRVLR LTPKG