Gene Sare_2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2114
Symbol
ID	5704968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2436186
End bp	2437154
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	71%
IMG OID	641271599
Product	alcohol dehydrogenase
Protein accession	YP_001536970
Protein GI	159037717
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.76358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00286846
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGTCGGG CGGTGATCGA CCGGCACGGG CCGCCGGGCG TGCTGCGGGT CGAGGAAGTC 
GAGGACCCTC TACCCACTGC TGGTCACGTC CTGGTCCGGG TGGCGGCGGC CGGCGTCAAC 
TTCGTCGACC TGCACCAACG TGGGGGCGCG TACCGGGTCG ACCTTCCGTT CCTGCCGGGG 
TTCGAGGGCA GCGGAACAGT GCTCGCCGTC GGTGACGGAG TCACCGGTGT GCACGAGGGG 
GACCGGATCG CCTGGTCCGG CTGCCCTGGT TCCTACGCCA CCCACTGTCT GGTGCCCGCC 
CAGCGAGTGG TGCCCGTACC GGATCCGATC TCGCTGACCG ACGCGGCGGC CGTCCTGGTC 
CAGGGCATGA CGGCACACTT CCTCGTGTCG GATGTGGCGC CCCTGGCCGA GGCTGACGTG 
TGCCTGGTGC AGGCAGCCGC CGGCGGGGTG GGTGGCCTGC TCACCCAACT GGCCGTGCTG 
CGGGGCGCCA CCGTGATCGG CACGGTGTCG AGCTCCGCGA AGGCGGCGGC GGCGCGGCAG 
GCGGGTGCGA CACACGTGGT CGACTACTCC CGGGAGCCGT TCCACCCCAG GGTTCTGGAG 
ATCACCGGTG GGCGCGGTGT GGACGTCGTG TACGACGCCG TGGGGCGCGA CACGTTCGAG 
ACCGGCCTGG CCTGCCTACG CCCGCGTGGC ATGTTCGTGC TGTACGGGCA GTCCAGCGGC 
CAGCCCGGAC CGATCGAGCC GCAGGTCCTG AACGCCCGTG GGTCGCTGTT TCTCACCAAG 
GCATCGCTCG GGCACTACGA CACCACCCGG GAACAGTTCC TGCGTCGGGC GGCCGCCGTG 
TTCGACCTGG TGGCGAGCGG CCGGCTACGT CCTCGGGTGC ACGCCACGTA CCAGTTGGAC 
GACGCCCCGG CAGCGCACGA GGCAGTCGAG TCCCGGACCG CCGCCGGTAA GGTTCTGCTC 
TGCCCCTGA

Protein sequence

MRRAVIDRHG PPGVLRVEEV EDPLPTAGHV LVRVAAAGVN FVDLHQRGGA YRVDLPFLPG 
FEGSGTVLAV GDGVTGVHEG DRIAWSGCPG SYATHCLVPA QRVVPVPDPI SLTDAAAVLV 
QGMTAHFLVS DVAPLAEADV CLVQAAAGGV GGLLTQLAVL RGATVIGTVS SSAKAAAARQ 
AGATHVVDYS REPFHPRVLE ITGGRGVDVV YDAVGRDTFE TGLACLRPRG MFVLYGQSSG 
QPGPIEPQVL NARGSLFLTK ASLGHYDTTR EQFLRRAAAV FDLVASGRLR PRVHATYQLD 
DAPAAHEAVE SRTAAGKVLL CP