Gene Sare_2412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2412
Symbol
ID	5703696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2777256
End bp	2778167
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	68%
IMG OID	641271889
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001537260
Protein GI	159038007
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.330008
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG ACGCACGTTC GCTGAGGGGG AAGGTAGCCC TGGTGGCCGG CGGTACCCGA 
GGTGGCGGCC GGGGTATCGC CGTTGAACTC GGTGCCGCCG GCGCAACGGT GTACGTCACC 
GGACGAAGTG GCACCGGTGA ACGCTCTGAC CTCGACCGAC CGGAAACGAT CGAGCAGACC 
GCCGAGCAGG TCACCGCCGC AGGCGGTCTG GGAATTCCTG TCCGAACCGA CCACAGCCGC 
CCCGAGCAGG TCGAGGCCCT CGTCAACCGG ATCGCCACCG AGCAGGACGG CCAGCTCGAC 
GTGGTGGTCA ATTCCGTATG GGGTGGCGAT CCGCTGACCG ACTGGGAACA TCCCCTGTGG 
GAGCAGGACC TGGCCACCGG CCTACGGCTG CTGCGGCAGG CGGTGGAAAC CCACATCATC 
ACCAGCCGCT TCGCGTTGCC CCTTCTGGTC GCCCGTGGCA GCGGCCTGGT TGTGGAAGTC 
ACCGACGGTA ACACCGCCCG CTATCGCGGC ACTCTCTTCT ATGACCTGGC AAAGTCCGCG 
GTCATTCGCC TCGCCGTCGC CCAGGCCGCC GAGCTCAAGC CGCATGGCGT GGCGGCGGTA 
GCCATCACGC CTGGTTTCCT CCGCTCGGAG GCCCTGCTCG AGCACTTCGG TGTCACCGAA 
GCCAACTGGC GCGACGGCGC GGCCCTGGAT CCGAACTTCG CCCATTCCGA GACCCCGGCC 
TACCTCGGCC GAGCCGTTGC CGCCCTGGCC GCTGACCCAC ACATCATGGC CAAGTCCGGA 
CGTGCCCTGG CCACCTGGGG CCTGTATCAG GAGTACGGTT TCACCGATGC CGACGGCACC 
CAACCGGACT TCGCAGCCCA CTGGGCCAAA AACCTGGAGG AACAGCATGG GCCCCTCGGA 
GACCCGCTCT AA

Protein sequence

MTTDARSLRG KVALVAGGTR GGGRGIAVEL GAAGATVYVT GRSGTGERSD LDRPETIEQT 
AEQVTAAGGL GIPVRTDHSR PEQVEALVNR IATEQDGQLD VVVNSVWGGD PLTDWEHPLW 
EQDLATGLRL LRQAVETHII TSRFALPLLV ARGSGLVVEV TDGNTARYRG TLFYDLAKSA 
VIRLAVAQAA ELKPHGVAAV AITPGFLRSE ALLEHFGVTE ANWRDGAALD PNFAHSETPA 
YLGRAVAALA ADPHIMAKSG RALATWGLYQ EYGFTDADGT QPDFAAHWAK NLEEQHGPLG 
DPL