Gene Sare_0962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0962
Symbol
ID	5703631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1085215
End bp	1086210
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	641270478
Product	aldo/keto reductase
Protein accession	YP_001535865
Protein GI	159036612
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0209073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGTGA CCTACGGTGC CGACGACACG CGCTACGACC AGATGACCTA CCGACGCAGC 
GGGGCCAGCG GGCTACGCCT ACCAGCGATC TCGCTCGGCC TGTGGCACAA CTTCGGGCCG 
GACCGCCCCT TCGATCGGCA GCGCGACATC GTCCGCCGGG CCTTCGACCT CGGTGTCACC 
CACTTCGACC TCGCCAACAA CTACGGCCCG CCGCCGGGAG CGGCCGAGGA GAACTTCGGC 
CGGATGCTCG CCACAGACCT GCGGCCGTAC CGCGACGAAC TGGTCATCTC CAGCAAGGCC 
GGCTATCTGA TGTGGCCCGG TCCGTACGGT GAGTGGGGAT CCCGCAAATA CCTCGTCGCC 
TCGTTGGACC AGTCGCTACG CCGCTTGGGG CTGGACTACG TCGACATCTT CTACAGCCAC 
CGGTACGACC CGGACACCCC GCTGGAGGAG ACGATGGGCG CACTGGACGC CGTCGTCCGG 
TCCGGCAAGG CACTCTACGT CGGCATCTCC AACTACAACT CGGAACAGAC CCGGCGGGCC 
GCGGCGATCC TGCGGGACCT GGGCACCCCG CTGCAGATCA ACCAGCCGTC GTACTCGATG 
CTGAACCGCT GGACCGAGGA GGACGGCCTG CTCGACACAC TGGCGGACGT CGGTGCCGGC 
TGCATCTCCT TCAGCCCGCT GGCGCAGGGC CTGCTCACCG ACCGCTACCT CGACGGCATC 
CCGGCCGACT CCCGGGTACG CACCAGCGTC CACCTGTCCG AGCGGGACGT GAACCCGGAA 
CGGCTGGCGA CGATCCGCGG ACTGGCCGCC ATCGCCCAAC GTCGCGGCCA GTCCCTCGCG 
CAGCTCGCAC TCGCCTGGGC ACTGCGCGAC CCCCGGATGA CCAGTCTGAT CATCGGCGCC 
AGCAGCGTCT CCCAACTCGA GGCCAACCTC GCCGCGCTGG ACAACCCCGA CTTGACCGCC 
GAGGAACTGG CCGAGATCGA CCGCCAGCTC AGCTGA

Protein sequence

MIVTYGADDT RYDQMTYRRS GASGLRLPAI SLGLWHNFGP DRPFDRQRDI VRRAFDLGVT 
HFDLANNYGP PPGAAEENFG RMLATDLRPY RDELVISSKA GYLMWPGPYG EWGSRKYLVA 
SLDQSLRRLG LDYVDIFYSH RYDPDTPLEE TMGALDAVVR SGKALYVGIS NYNSEQTRRA 
AAILRDLGTP LQINQPSYSM LNRWTEEDGL LDTLADVGAG CISFSPLAQG LLTDRYLDGI 
PADSRVRTSV HLSERDVNPE RLATIRGLAA IAQRRGQSLA QLALAWALRD PRMTSLIIGA 
SSVSQLEANL AALDNPDLTA EELAEIDRQL S