Gene Caul_4830 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4830
Symbol
ID	5902292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5227265
End bp	5228263
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	68%
IMG OID	641565350
Product	alcohol dehydrogenase
Protein accession	YP_001686448
Protein GI	167648785
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGG TGCTCAGCAA GGCGGTCGGC GGACCCGAGA CCCTGGTGCT GGAGGAGCTT 
CCCGACCCCG TCGCCGGTCC GGGCCAGGTG CTGCTGGAGA TCAAGGCCTG CGGCGTCAAC 
TATCCCGACG TGCTGATCAT CGAGGACAAG TACCAGTTCA AGCCCGAGCG GCCGTTCGCG 
CCAGGCGGCG AGGTTTCGGG CGTGGTGCTG GCCCTGGGCG AGGGCGTGAC GACCCTGAAG 
GTCGGCCAGC GCGTGCTGGC CTCGACCGGT CACGGCGGCA TGGCCGAGAA GGTGGCGCTG 
GACGCCATGC GCTGCACGCC CATTCCCGAC AACATGCCCT TTGATGAAGC CGCCGCCTTC 
ATCCTCACCT ACGGCACGTC TTACTATGCC CTGAAGGACC GCGGCCATCT GAAGGCCGGC 
GAGACCCTGC TGGTGCTGGG CGCGGCCGGC GGCGTCGGCC TGGCGGCCGT CGAGCTGGGC 
AAGGCGGCCG GGGCGCGGGT CATCGCCGCC TGCTCTAGCC AGGAGAAGGT GGACCTGGCG 
ATCAAGCACG GCGCCGACGC CGGCGTGGTC TATCCGCGCG GTCCGTTCGA CAAGGACGGT 
CAGAAGGCCC TGGCGACCCT GATCAAGGAG GCCTGCGGGC CGAACGGCTG GGACGTGGCC 
TATGACGCGG TCGGCGGCGA CTATTCCGAA GCCACGATCC GCGCCGCCGG CTGGAACGGC 
CGCTTCCTGG TCATTGGCTT CCCGTCGGGC ATTCCGAAGA TCCCGCTGAA CCTGACCCTG 
CTGAAGTCCT GCGACATCGT CGGGGTGTTC TGGGGCGCCT CGGTGGCCCG CGATCCCAAG 
GGCCACGCCC AGAACGTGCG CGAGCTGATG GATCTGTACC AGGCCGGCAA GATCAAGCCC 
TATGTCTCCG AACGCTTTCC CTTGGAGAAG GCCGGCGACG CCATCGCCCA CCTGGCCAGC 
CGCAAGGCCA TGGGCAAGGT CGTGGTGGTC ACGGACTAG

Protein sequence

MKAVLSKAVG GPETLVLEEL PDPVAGPGQV LLEIKACGVN YPDVLIIEDK YQFKPERPFA 
PGGEVSGVVL ALGEGVTTLK VGQRVLASTG HGGMAEKVAL DAMRCTPIPD NMPFDEAAAF 
ILTYGTSYYA LKDRGHLKAG ETLLVLGAAG GVGLAAVELG KAAGARVIAA CSSQEKVDLA 
IKHGADAGVV YPRGPFDKDG QKALATLIKE ACGPNGWDVA YDAVGGDYSE ATIRAAGWNG 
RFLVIGFPSG IPKIPLNLTL LKSCDIVGVF WGASVARDPK GHAQNVRELM DLYQAGKIKP 
YVSERFPLEK AGDAIAHLAS RKAMGKVVVV TD