Gene Caul_2341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2341
Symbol
ID	5899796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2539837
End bp	2540883
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	67%
IMG OID	641562832
Product	alcohol dehydrogenase
Protein accession	YP_001683966
Protein GI	167646303
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGA CAATGAAGGC GGCCGTGGTC CGCGCCTTCG GCCAGCCGCT CGTGATCGAG 
GAGGTGCGGG TTCCGCAGGT CGGCCCCGGC CAGATCCTGG TCAAGATCGC CGCCGCCGGG 
GTTTGCCACA CCGATCTGCA CGCCGCGCAG GGCGATTGGC CGGTCAAGCC CAATCCGCCC 
TTTATTCCAG GCCATGAGGG CGCCGGCCAT GTGGTCGCCG TGGGCGCGGG CGTCACCCAT 
GTCCGGGAAG GAGACCGCGT CGGCGTGCCC TGGCTCTACT CCGCCTGCGG TCACTGCGTT 
CATTGCCTCG GCGGCTGGGA GACCCTCTGC GAACTGCAGC AAAACACCGG ATATTCGGTG 
AACGGCAGCT TCGCTGACTA TGTGCTCGCC GATCCCAACT ATGTCGGCCA CTTGCCCGAC 
AACGTCGGCT TCGTCGAGAT CGCCCCCGTG CTGTGCGCGG GCGTCACGGT CTATAAGGGC 
CTCAAGATGA CCGAGGCCAA GCCGGGCGAC TGGGTGGCCA TCTCTGGCGT CGGCGGCCTT 
GGGCACATGG CTGTCCAATA CGCTAGAGCG ATGGGATTGA ACGTCGCCGC CGTCGATATC 
GATGACCAGA AGCTGGCCCT GGCGCGCGCT CTTGGTGCGA CCGTGACCGT CAACGCGCTC 
CACGCCGACC CGGTGGCGGT GCTCAAGAAG GAGATCGGCG GCGCCCACGG CGTCCTCGTG 
ACCGCCGTCT CGCCAAAGGC CTTCGCCCAG GCGCTGGGCC TGGTGCGCAG AGGCGGCGCC 
GTCGCCCTGA ATGGATTGCC GCCGGGGGAT TTCCCCCTCT CCATCTTCGA CACCGTGCTC 
AACGGGATCA CCATCCGCGG TTCGATCGTC GGCACGCGGC TGGACCTGCA AGAGGCTCTG 
GCCTTTGCCG GTGAGGGAAA GGTGCGCGCC ACCGTCTCGA CCGATCGGCT CGAGAACATC 
AATGCAGTTT TCGACCGCAT GCGTCGCGGC GAGATCGAGG GCCGGGTCGT GCTCGACCTG 
TCGGATGGAC CCCGCAGTGG TTCATGA

Protein sequence

MEKTMKAAVV RAFGQPLVIE EVRVPQVGPG QILVKIAAAG VCHTDLHAAQ GDWPVKPNPP 
FIPGHEGAGH VVAVGAGVTH VREGDRVGVP WLYSACGHCV HCLGGWETLC ELQQNTGYSV 
NGSFADYVLA DPNYVGHLPD NVGFVEIAPV LCAGVTVYKG LKMTEAKPGD WVAISGVGGL 
GHMAVQYARA MGLNVAAVDI DDQKLALARA LGATVTVNAL HADPVAVLKK EIGGAHGVLV 
TAVSPKAFAQ ALGLVRRGGA VALNGLPPGD FPLSIFDTVL NGITIRGSIV GTRLDLQEAL 
AFAGEGKVRA TVSTDRLENI NAVFDRMRRG EIEGRVVLDL SDGPRSGS