Gene Sare_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2801
Symbol
ID	5706157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3180844
End bp	3181770
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	69%
IMG OID	641272257
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001537627
Protein GI	159038374
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.164593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000184806
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACAGACC AGCAGTTCGC GTTGGATGGC ATGGTCGCGA TCGTGACCGG GGCGGGCAAC 
GGCCTGGGTC GCGCCGAGGC CGTTGAGTTG GCAGCCAGCG GCGCCCGCCT CATCCTCAAC 
GACCTTCCCG GCGACGCCGT GGCCGCCGTG GCCGCCGAGA TCGCGGCAGC GGGCGGCGAG 
GCCACCGTGT GCACCGGCGA CATCGGGGAA TGGTCGACCG GTGAGTCCCT GCTGGGCGCA 
GCCCTCGACA CGTACGGCAG GCTCGACATC CTGGTCAACA ACGCCGGCGT ACTCCGCGAC 
CGGATGGTCT TCACGATGTC GGCGCAGGAA TGGGACCTCG TCCTGCGAGT GCATCTGCGC 
GGTCACTTCG TGACCACCCG CCTGGCCACC GCCTACTGGC GCGAGCGGAG CAAGGAGCTC 
GGCTCCCCGG TCTACGGTCG GATCATCAAC ACCTCCTCCG AGGCGTTCCT GCTCGGCTCA 
CCCGGCCAGC CGAACTATGC TGCCGCGAAA GCCGGCATCG TGGCACTCAC CGTCGCGACC 
GCGCGTAGCT GTGCTCGGTA CGGCATACGG GCAAATGTCA TCTGTCCACG AGCACGTACC 
GCAATGACCG CCGACCTCAT GGGATCCACG CCCGAGGGGA CTGCCGATCC CCTGTCGCCA 
GCCCATGTCG CACCGCTCGT GCGGTACCTG GCCAGCCCGG CGGGAGACCC GATCAACGGC 
GAGGTCTTCG TGATCCACGG TGGCGTGGCA GCGGTACTGG CGCCACCCAC GGTGCGCGCG 
AGCTTTCAGA CCGAGGAAGG ATCCTGGTCG CCGAAGGGCC TGCACGACGC CCTGGGCCCC 
CTGTTCCAGC AGAGTCCGCC CGAGGCCGGG TTCGCCTGTC AGGCCACCCT GCCGCTGGCA 
ACGACCACGT TCGGTGAAGG CAGGTGA

Protein sequence

MTDQQFALDG MVAIVTGAGN GLGRAEAVEL AASGARLILN DLPGDAVAAV AAEIAAAGGE 
ATVCTGDIGE WSTGESLLGA ALDTYGRLDI LVNNAGVLRD RMVFTMSAQE WDLVLRVHLR 
GHFVTTRLAT AYWRERSKEL GSPVYGRIIN TSSEAFLLGS PGQPNYAAAK AGIVALTVAT 
ARSCARYGIR ANVICPRART AMTADLMGST PEGTADPLSP AHVAPLVRYL ASPAGDPING 
EVFVIHGGVA AVLAPPTVRA SFQTEEGSWS PKGLHDALGP LFQQSPPEAG FACQATLPLA 
TTTFGEGR