Gene Sare_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2035
Symbol
ID	5705689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2329578
End bp	2330603
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	71%
IMG OID	641271525
Product	aldo/keto reductase
Protein accession	YP_001536896
Protein GI	159037643
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.848931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000622322
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGGATC CGGCCCGGTC CAGGGAGGTA CGGGTGGCGT CGCTGCATGT CCGGCTCGGT 
CGGACCGGCC TGCGCGTGAG TCGGGTCGCG ATCGGAACCG TCAACTTCGG CGGGCGAGTC 
GACGAGGCGG ATGCCCATCG GCTGCTGGAC CATGCGTGGA ACCGCGGGGT GAACCTGGTC 
GACACCGCGG ACATCTATGG ATGGCGCGTC CACCGTGGCT GGACCGAGGA GATGATCGGC 
CGCTGGCTGG CCGAGGATCC GTCCCGCCGC GACTCGGTGG TGCTGGCCAC CAAGGTGGGT 
AATCCGATGG GCGACAGCCC CAACGACCGG GGACTGTCCG CCCGGCACAT CATCGCCGCC 
TGCGAGGCGT CGCTGCGTCG GTTGCAGACC GACACCATCG ACCTCTACCA GATGCACCAG 
GTCGACCGGG AGGTCGGCTG GGACGAAATC TGGCAGGCCA TGGAGCAACT GGTGCACCAG 
GGCAAGGTCC GCTACGTGGG GTCCTCCAAC TTCGCCGGCT GGGACCTGGT CAGCGCGCAG 
GAGGCCGCTC GCCGACACCG GCTGCTCGGT CTCGCCAGCG AGCAGTGCGT CTACAACCTG 
GTGACCCGGT ACGTCGAGTT GGAGGTGCTA CCGGCCGCCG CGGCCGAGGG CATCGGCGTG 
CTGGTCTGGT CGCCGCTGCA CGGTGGCCTG CTCAGCGGCG TGCTGCGTAA GCGGGAGGAG 
GGCACGGCGG TGAAATCCGC CCAGGGGAGG GCCGTCGAGG GGCTGGCCCG GCACCGCTTG 
GCGCTGGAGA CGTACGAGCG GTTCTGCGGC GACCTCGGAC GGGACCCGGC CGGGGTCGGC 
ATGGCGTGGG TGCTGCACCG GCCGGGAGTG ACCGCCGCCG TGGTCGGCCC CCGTACGCCG 
GAGCACCTGG ACGGTGCCCT GCGCGCGCTG GAACAGCCAC TGGCGGCCGA CGAACTGGCC 
CGGTTGGACG AACTGTTCCC GCCGCCGGGG CGCGGTGGTC CGGCACCGGA CGCCTGGATG 
TCCTGA

Protein sequence

MSDPARSREV RVASLHVRLG RTGLRVSRVA IGTVNFGGRV DEADAHRLLD HAWNRGVNLV 
DTADIYGWRV HRGWTEEMIG RWLAEDPSRR DSVVLATKVG NPMGDSPNDR GLSARHIIAA 
CEASLRRLQT DTIDLYQMHQ VDREVGWDEI WQAMEQLVHQ GKVRYVGSSN FAGWDLVSAQ 
EAARRHRLLG LASEQCVYNL VTRYVELEVL PAAAAEGIGV LVWSPLHGGL LSGVLRKREE 
GTAVKSAQGR AVEGLARHRL ALETYERFCG DLGRDPAGVG MAWVLHRPGV TAAVVGPRTP 
EHLDGALRAL EQPLAADELA RLDELFPPPG RGGPAPDAWM S