Gene Caul_5020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5020
Symbol
ID	5902482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5423458
End bp	5424423
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	641565541
Product	alcohol dehydrogenase
Protein accession	YP_001686638
Protein GI	167648975
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00109136
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCCA TACAAGCCGC CCGCACCGGC GGCCCCGAGG TTCTCGAGGC CGTCGAGCGT 
TCCGTCCCCA CGCCCGGACC TGGCCAGATC CTGGTTCGTC ATCAAGCCGT CGGCTTGAAC 
TTCATCGACA CCTATCAGCG CAGCGGCCTC TACCCGATGA AGACGCCGGT CGTGCTCGGC 
CTCGAGGCGG CGGGCGTCGT CGAGGAGGTC GGCGAGGACG TCACCCGGTT CAAGTTAGGC 
GATCGCGTCG CCTATAACGG CACGCTCGGC GCCTATGCCG AGGCGGCCGT CGTGCCGGCC 
GACCGCGCCG TGAAGGTTCC TGACGCGGTC AGCCTCGAGA CCGCGGCGGC CGTCCTGCTG 
AAGGGCATGA CCGCGGAGTT TCTGGTCCAG CGTTGCCACA GGGTCGAACC CGATCAAACC 
GTGTTGATCC ATGCGGCGGC GGGCGGGGTT GGCTCGATCC TGGTGCAATG GGCCAAGGCG 
TTGGGGGCGA CCGTGATCGC CACCGTCGGC TCGGAAGCCA AGGCCGCCCT CGCCCGTGAC 
CATGGCGCCG ACCATGTGAT CCTCTATGGC GAGGAGGACG TCGCGGCTCG GGTGTCCGAG 
ATCACCGGCG GGCAAGGCGT GGCGGTCGTC TATGACGGGG TCGGCAAGGA CACCTTCGAG 
GCCAGCCTCA AGAGCCTGGC TCGACGCGGT ATGCTGGTCA CCTTTGGCAA CGCCTCAGGA 
CCCGTGCCGC CGTTCGCGCC GCTCGAACTG GGGAGCAAGT CGCTGTTCCT CACCCGACCG 
AAGCTATTCG ACTACATCGC CACGACCGAG GAGTTGGATG AAAGCGCGGC GGCCCTGTTC 
GCCGTGCTGG AGTCCGGCGC CGTGAAGATC GAGGTTGGAC AGACCTTCCC GCTCTCCGAG 
GCTCGGGCCG CGCACGAAGC CCTGGAGGGT CGGCGAACGA CAGGGGCGAC GCTGCTTATT 
CCGTAG

Protein sequence

MLAIQAARTG GPEVLEAVER SVPTPGPGQI LVRHQAVGLN FIDTYQRSGL YPMKTPVVLG 
LEAAGVVEEV GEDVTRFKLG DRVAYNGTLG AYAEAAVVPA DRAVKVPDAV SLETAAAVLL 
KGMTAEFLVQ RCHRVEPDQT VLIHAAAGGV GSILVQWAKA LGATVIATVG SEAKAALARD 
HGADHVILYG EEDVAARVSE ITGGQGVAVV YDGVGKDTFE ASLKSLARRG MLVTFGNASG 
PVPPFAPLEL GSKSLFLTRP KLFDYIATTE ELDESAAALF AVLESGAVKI EVGQTFPLSE 
ARAAHEALEG RRTTGATLLI P