Gene Sare_2123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2123
Symbol
ID	5704749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2446325
End bp	2447239
Gene Length	915 bp
Protein Length	304 aa
Translation table	11
GC content	67%
IMG OID	641271608
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001536979
Protein GI	159037726
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0115254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.127014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA AGCCGATGGC AGGAAAGGTG GCGCTCGTCG CCGGTGGAAC CCGGGGCGCG 
GGGCGAGGAA CAGCTATCCA GCTCGGAGCG GCCGGGGCGA CGGTCTACGT GACCGGTAGG 
TCGACCCGTG CCCAACGGTC GGAGATGAAT CGGCCGGAGA CCATCGAGGA GACCGCCGAG 
TTGGTCACGG TCGCCGGCGG AGCCGGCATC GCGGTGCAGG TCGACCATCT GGTTCCCGAC 
GAGGTACGCG ATCTGGTCGC CCGGATCGAA TTCGAGCAGG GAGCCCTTCA CGTACTGGTC 
AACGACATCT GGGGCACCAG CACAATTGAG TGGAACAAGC CGGTCTGGGA GTCCGACCTG 
AACGCCGGGC TGCGCACGCT GCGCCTCGCC GTGGACACCC ACGCCATCAC CAGCCACTTC 
GCGTTGCCTC TGCTACTCAA GAACCCTGGT GGCCTGGTCA TCGAGATGAC CGACGGCACG 
GACGAGTACA ACGCGGTCAA CTACCGCAAC TCCTTCTTCT ACGACCTCGC CAAGGGCGCC 
GTGAGCCGGA TGGCGTTCGC ACTGGCGCAC GAACTCAGGT CGCATGACGC GACGTCGGTG 
CTGCTCACCC CGGGATGGTT GCGCTCCGAG GACATGCTCG ACGACTTCGG CGTCACCGAG 
GAGAACTGGC GCGACGCGCT CACGTCGGAG CCGCACTTCG CGATCTCCGA GAGCCCGGCG 
TACGTCGGCC GTGCGGTGGT GGCCCTGGCG CAGGATCCCG ACGTGTCCCG TTGGCACGGC 
AGATCCCTCT CCAGCGGGGA ACTGGCGAAG GTCTACGGCT TCACCGACCG TGATGGGAGT 
CAGCCCGACG CCTGGCGATA CGTGGTCGAG GTGCAGGACG TCGGCAAGCC CGCCGACCCG 
ACCGGATACC GCTGA

Protein sequence

MTEKPMAGKV ALVAGGTRGA GRGTAIQLGA AGATVYVTGR STRAQRSEMN RPETIEETAE 
LVTVAGGAGI AVQVDHLVPD EVRDLVARIE FEQGALHVLV NDIWGTSTIE WNKPVWESDL 
NAGLRTLRLA VDTHAITSHF ALPLLLKNPG GLVIEMTDGT DEYNAVNYRN SFFYDLAKGA 
VSRMAFALAH ELRSHDATSV LLTPGWLRSE DMLDDFGVTE ENWRDALTSE PHFAISESPA 
YVGRAVVALA QDPDVSRWHG RSLSSGELAK VYGFTDRDGS QPDAWRYVVE VQDVGKPADP 
TGYR