Gene Caul_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0538
Symbol
ID	5897993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	586824
End bp	587876
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	65%
IMG OID	641561021
Product	aldo/keto reductase
Protein accession	YP_001682170
Protein GI	167644507
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTTACA AACTCTTTGG CGAACACACG GGGCTGCGGG TCTCCGAGCT CGTGCTCGGG 
ACCGCGAATT TCGGCACGCG ATGGGGACAT GGCGCCGATG CGGATGAGGC CCGCCGCATC 
TTCGACGCCT ACGCCGATGC CGGCGGCAAT TTCATCGACA CGGCCAACGG CTATCAGGAC 
GGCCAGTCCG AGGAGTTTTT GGGCGACTTG TTGGCGGGAC GGCGCGACGA CTTTGTGCTC 
GCCACGAAGT ACACCGTGAA GACGGATGCC AACTCCGGCA TCCTCGTCAC TGGCAATAGC 
CGTCAAGCGA TGGTCTCGTC CGTCGAGGCA AGCTTGAAGC GACTCAAGAC CGACCGGATC 
GACCTCTACT GGGCTCATGT CTCGGACGGC GTCACACCGC TTGAGGAGAT CGTGCGAGGC 
TTCGACGACC TCGTTCGGAC CGGCAAGATC CTCTATGCCG GCCTTTCAAA TTTTCCCGCG 
TGGCGGGTCG CTCGGGCCGC GACCATCGCC GCGCTGCGTG GCGCCGTCCC GATCGCGGGC 
CTTCAGGTCG AGCACAGCCT CGTCGCTCGC ACGGCCGAGC AGGAGCTCCT CTCGGCCGGG 
CGTGCACTTG GTCTCGGCGT CGTGGCCTTC TCGCCGCTCG GCGGCGGTAT GCTCACCGGA 
AAATACCGCA AGCCAAATGG CGAGAAGGGA CGCGAGGAGG GTCTTGCCGG GGCCGGCTTC 
CAGCCCGAGA ACTCCCCGCA GCGCACCGCC ACCCTCGACA CCTTGATCGC GGTCGCAGAA 
GAGGCCGGCG CGACGCCTAG CGAGATCGCC ATCGCCTGGG TCGCCGCCAA GGGCTCGCTT 
CCGATCATCG GGCCACGCAC GCTTGCTCAG CTTGAAAACA ACCTTGCTTC AGCAAAGGTG 
ACGCTGTCGC CCGAGCACGT TGCGCGCCTG GACGCGGTAA GCGCGCCCCC ACCGGTTTAC 
CCCTACACGG TACTCAATGA TCCACGGATC AGGGATATCA TCACGAGCGG CAAGTTCGGG 
CAGATCGACG CCCCCGCCGA GTCCGTCGCA TGA

Protein sequence

MRYKLFGEHT GLRVSELVLG TANFGTRWGH GADADEARRI FDAYADAGGN FIDTANGYQD 
GQSEEFLGDL LAGRRDDFVL ATKYTVKTDA NSGILVTGNS RQAMVSSVEA SLKRLKTDRI 
DLYWAHVSDG VTPLEEIVRG FDDLVRTGKI LYAGLSNFPA WRVARAATIA ALRGAVPIAG 
LQVEHSLVAR TAEQELLSAG RALGLGVVAF SPLGGGMLTG KYRKPNGEKG REEGLAGAGF 
QPENSPQRTA TLDTLIAVAE EAGATPSEIA IAWVAAKGSL PIIGPRTLAQ LENNLASAKV 
TLSPEHVARL DAVSAPPPVY PYTVLNDPRI RDIITSGKFG QIDAPAESVA