Gene Caul_0526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0526
Symbol
ID	5897981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	575205
End bp	576230
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	641561009
Product	aldo/keto reductase
Protein accession	YP_001682158
Protein GI	167644495
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.51564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACTTA GGAAACTTGG CGCGTCGGGA TTTCTGGTCC CGCAGTTGAG CCTGGGGACG 
GGCATGTTCG TACCGAGCGA GGTCTTTTCG CAAGGAAACG TGGACTTGCC GCTCGCGACG 
CGGCTCATCG ACATCAGCAT CGAGCACGGC GCCAACATGT TCGATTCCGG CCACACCTAC 
TGGAATGGTC ATTCAGAGAT CCTGCTTGGC GAAGCGCTCA AGGGGCGCCG CCACAAGGCG 
ATCATTTCGA CCAAGGCGGG CCACCCCCCG CAGGATGGCG GGTCCAACGA TATTGGCGCC 
TCGCGCTATC ACCTGACCCA GGCGATCGAC CAATCCCTCA AGCGTCTGGG AACCGACTAT 
ATCGATGTGT TCCAACTGCA CACCTTCGAC GCCTTGACGC CGCCCGAAGA GACGCTGGCC 
ACTCTCGATA CGTTCGTACG CGCCGGCAAG ATCCGCTATA TCGGCGTTTC CAACACGCCA 
GGCTGGGCGC TGATGAAGTC TCTCGCCGTC GCCGAGCGCG CGTCCCTGCC GCGCTATGTG 
GTTCATCAGG TCTATTATTC GCTGATCGGG CGCGACTATG AATGGGAACT GATGCCGCTT 
GGCGCGGACC AAGGGGTTTC CGCCGCGGTC TGGAGTCCCC TGGGGTGGGG GCGGTTGACC 
GGCCGCCTCA AGCGCGGGCA GCCCGCGCCG GCCGACAGCC GATTGATCTT GAGCGAACAC 
ATCGCGCCTC AAGCCGACGA GCAGACGCTA CATGACGTGC TTGATGTTCT GCGGGAACTG 
GCCGAGGAGA CTGGCAAGCT CATCCCGCAG ATCGCGATCA ACTGGCTCCT CCAGCGCCCC 
ACGGTCGCCA CGGTGATCAT GGGCGCCCGA ACGGAAGAGC AGTTGCTGCA GAACCTCGGC 
GCGGCGGGCT GGTCCCTGGC CCCCGAGCAA ATCAAGCGCC TTGATGCGGT CAGCCGCCGC 
CGCCCGTCCT ATCCCACGGA CTTTTATCTT ACCGCCGATC GCCACCGCAA TCCGCCCTCG 
GTCTAG

Protein sequence

MELRKLGASG FLVPQLSLGT GMFVPSEVFS QGNVDLPLAT RLIDISIEHG ANMFDSGHTY 
WNGHSEILLG EALKGRRHKA IISTKAGHPP QDGGSNDIGA SRYHLTQAID QSLKRLGTDY 
IDVFQLHTFD ALTPPEETLA TLDTFVRAGK IRYIGVSNTP GWALMKSLAV AERASLPRYV 
VHQVYYSLIG RDYEWELMPL GADQGVSAAV WSPLGWGRLT GRLKRGQPAP ADSRLILSEH 
IAPQADEQTL HDVLDVLREL AEETGKLIPQ IAINWLLQRP TVATVIMGAR TEEQLLQNLG 
AAGWSLAPEQ IKRLDAVSRR RPSYPTDFYL TADRHRNPPS V