Gene Sare_1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1036
Symbol
ID	5706535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1159824
End bp	1160825
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	67%
IMG OID	641270552
Product	alcohol dehydrogenase
Protein accession	YP_001535936
Protein GI	159036683
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.255721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.276048
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGGCAT ATGTGCAGAC CAAGTACGGC GACCCGAGCG TCATGCGACT CATGGATGTG 
CCCAAGCCCA CACCAGAGCA CGGTGAGGTG CTGATTCGGG TACGGGCAGC AGGCCTGAAT 
CCGGTGGACT ACCACCTCCG GCAGGGCAAG ATGCGGATGA TCGCCCGTTT GAAACTGCCC 
AGGGTGGCCG GCAGCGAGCT GGCGGGCGTG GTGGAAGCCG TCGGGCCCGG CGTCACCAAC 
CTCGCCGTCG GGGATCGGGT GTTCACCCGA GTGGACGTCA TGAAGCTGGG CGCCTTCGCC 
CCCTATGCGG TTGTCGCGGC GGACCTCGTC GCCCCGATGC CACAGTCGCT CGACTTCACC 
GAGGCCGCCG GGCTTCCCCT GGCCGGCCTC ACCGCGCTAC AGGCCCTTCG GGACGAGCTC 
AACATCGAGA AGGGTCAACG GATCTTCATT TCCGGCGGTG CGGGCGGCGT GGGCACACTC 
GCCATCCAAC TCGCGGCGTG GATGGGCGCC CACGTCGCCA CGACCGCCTC GCCCGCGGGC 
GAGAATCTGG TGCGTTCCCT CGGCGCCGAG ACGGTCCTCA ACTACCAGAC GACCAGCTTC 
AAGGACGTTC TGCGGGACTA CGACGCGGTG CTCGACCTCC GGGGTGGTCA GGATCTGGCG 
GACAGCTTCG CCATTGTTCG TCCCGGAGCC AAGGTGGTGT CCGTCGCGGG AGTGCCCGAA 
CGCAACTCCG CCACGGACCT GGGGGCCGGT CCACTGGTCG GTGCCTTGTT CAATCTGCTC 
AGTGGCAAGG TCCGGCGGCA GGCCAAGGCA CACGGGGTCA CCTACCGGTA CCTGTTCATG 
CACCCCAGCG GTGCCGATCT GCGAATCCTG GCCGACCTCG TCGACGGCGG GAACCTGAAG 
GTGGTGACGG ACCAGGTCTT TCCCTTCGAG GAGATCGCGG ACGCCTTCGC CCACCTCGAG 
CGCGGCCGTG CCAAGGGAAA GATCATCGTT GCGATGCCCT GA

Protein sequence

MQAYVQTKYG DPSVMRLMDV PKPTPEHGEV LIRVRAAGLN PVDYHLRQGK MRMIARLKLP 
RVAGSELAGV VEAVGPGVTN LAVGDRVFTR VDVMKLGAFA PYAVVAADLV APMPQSLDFT 
EAAGLPLAGL TALQALRDEL NIEKGQRIFI SGGAGGVGTL AIQLAAWMGA HVATTASPAG 
ENLVRSLGAE TVLNYQTTSF KDVLRDYDAV LDLRGGQDLA DSFAIVRPGA KVVSVAGVPE 
RNSATDLGAG PLVGALFNLL SGKVRRQAKA HGVTYRYLFM HPSGADLRIL ADLVDGGNLK 
VVTDQVFPFE EIADAFAHLE RGRAKGKIIV AMP