Gene Caul_0488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0488
Symbol
ID	5897943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	530393
End bp	531499
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	641560971
Product	aldo/keto reductase
Protein accession	YP_001682120
Protein GI	167644457
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.807596
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCTTG ACCTCTACCG TCCACTGGGC CGTTCCGGCT TGATCGTCAG CCCCCTGGCC 
CTTGGAACGA TGACCTTCGG CGTGGCCCGT TGGGGAATGG AGCGTCCAGA CGCTGAGGCC 
GTGTTCGACG CCTATGTTGA GGCGGGCGGA AATCTGATCG ACACGGCGGA CGTCTACGCC 
GCAGGCGCCG GGGAGACGAT GTTGGGCGAG ATGCTCGCCG AGCGCGGAAA CCGGCATGAA 
CTGGTATTGG CCACGAAGTC AGGCTTCGCC ACCGGCCGCG GACCTCACGC GGGCGGCAAT 
GGCGCCAAAC ATATCCATGC GGCGCTCGAG GGCTCGCTGC GCCGTCTCAA GACCGACTAT 
ATCGACCTGT ACTGGATCCA CGTCTGGGAC TCGGTGACGC CTCCCGAGCA GTTGTTGGAG 
ACGATGTCCG CGCTCGTCAG AGCCGGAAAG ATTCGCTATT GGGGCATGTC GAACACCCCC 
GCCTGGTATG TCGCCCGCGT CGTGACTCTG GCGATGGCCC GGGGCCAGCC GGGCCCGATC 
GCCCTGCAGT ATTTCTATTC TCTGGTCAGC CGCGAGATCG AGGCGGAGCA TGTTCCGCTC 
GCGCTCGACA CGGGCCTTGG CGTGATGCCC TGGAGCCCGC TGGCCTATGG CCTGCTCACG 
GGCAAGTACG ACAGGGCCAC GGTGGAGGCG TCGCCGTCTC GCGCCGGGGG CCTGCCCAAC 
GAGGCGGCGA CTGATGGCGC CAAGGCCGAC GGCGGGGCGC GGCTGGACGG GGCCAACCCT 
TTCGGCGACA CGCTGTTCAC CGAGCGCAAC TGGAAGATCG TCGACGTCCT GAAGGCCGTC 
GCCTTGGAAG TCGGGGAGCA GCCCGCAAAG GTCGCGCTGG CCTGGGCCCT CTCGCGCCCA 
GCGGTCGACA CCGTCCTGAT CGGCGTCAGT CGGGTCGAGC AGTTGCGGGA TAATATGGGC 
GCCGTCACCC TGCGCCTAGC GGCGGAGCAT CTTGCTGCGC TGGACGAGGC TAGCCGGCCG 
GCGCTCCCGA TGCTGTACGG CCTGTTCAGT GACGAGATGC GTCGGCAGGT CGTCTTCGGC 
GGAGCCCCAG TGGCGACGAG ATCATAG

Protein sequence

MSLDLYRPLG RSGLIVSPLA LGTMTFGVAR WGMERPDAEA VFDAYVEAGG NLIDTADVYA 
AGAGETMLGE MLAERGNRHE LVLATKSGFA TGRGPHAGGN GAKHIHAALE GSLRRLKTDY 
IDLYWIHVWD SVTPPEQLLE TMSALVRAGK IRYWGMSNTP AWYVARVVTL AMARGQPGPI 
ALQYFYSLVS REIEAEHVPL ALDTGLGVMP WSPLAYGLLT GKYDRATVEA SPSRAGGLPN 
EAATDGAKAD GGARLDGANP FGDTLFTERN WKIVDVLKAV ALEVGEQPAK VALAWALSRP 
AVDTVLIGVS RVEQLRDNMG AVTLRLAAEH LAALDEASRP ALPMLYGLFS DEMRRQVVFG 
GAPVATRS