Gene Sare_3638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3638
Symbol
ID	5703332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4197893
End bp	4199065
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	74%
IMG OID	641273063
Product	alcohol dehydrogenase
Protein accession	YP_001538427
Protein GI	159039174
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000808201
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGGGCAC TGTGCTGGAC CGACACCGGT CAGATCGCGG TACGACAGGT GCCCGACCCG 
GAACTACGCA ACGGCCACGA CGCGATCGTG CAGGTACGGC AGAGCGCCAC CTGTGGCGGG 
GACCTGCCAC TTCTGGCTGG CCGGGCTCCG TACCTGGCCG ACGGCGACGT GCTCGGGCAC 
GAATTCCTGG GCGAGGTGGT CACGGTGGGG CCGCAGGTAC GCCGGCACCG GGTCGGCGAC 
CGGGTGGTGG TCAGCTCCAC CGTGGCCTGT GGCTCCTGTT GGCAGTGCCG CTCCGGGGCG 
CCGTGGTGCT GCGACAACGG AAACCCGGCA CCGGAGGCGA GCGAGCTGGC GTACGGGCAT 
CCCGTGCCCG GCGCCTTCGG CCGGCCCACC GCGACGGGCG GGTTCGCCGG TGGTCACGCC 
GAGTATGTGC GCGTCCCGTA CGCCGACGTC GGTGCGTACC GCATCCCTGA CCAGGTCAGC 
GACGACCGGG CGCTGTTTGC CGCGGACGCC GCCCCGGCCG GTTGGCTCGC CGCCGAGCTG 
GGCGGGGTCC GCACCGGATC CGTGGTGGCC GTCTGGGGCG CCGGTGCGGT CGGTCAACTC 
ACCGCCCGCG CGGCCGGCAT GCTCGGCGCC GACCGGGTGA TCGTGATCGA CCCGCGCGAC 
GATCGGCTGC GGATGGCACG GCGGCACACG GACGCCGAGA CGATTGACCC GCGGCACGCC 
GACGTGCCCG CCGAGCTGCG CGAGCGGACC GGCGGGCGGG GACCGGACGT GTGCGTGGAG 
GCGGTCGGAC CGGCCTGGGA CGGGCGGCCG CGGTCACTGG CCGACCGATT CACCGACGCG 
GCGGAGCGAC CCCCGGCGGT CCGCGAGGCG GTGCACGTCT GCCGCAAGGG CGGCACGGTG 
GTCGTACTCG GCGAGTACGC CGGATACGTG GACACCTTCC CGCTCGGTGC GGTCGGTGCC 
AAGGGGTTAC GGGTTCGCGG GGTACGTCAG CACGGAGCGC GGCACGTGCC GACGCTGCTG 
GAACGGATGG CCCGGGACGA GTTGCGCACC GAGCACCTGG CCACCCACCG GCTGCCGCTG 
GAGGAGGGGG CGCGCGGCTA CGCGCTGTTC CGGGACCGGC GAGACGGCTG CGTGCGGGCC 
GTGTTCAGTC CGGATCTGCC CCCTGCCGGA TGA

Protein sequence

MRALCWTDTG QIAVRQVPDP ELRNGHDAIV QVRQSATCGG DLPLLAGRAP YLADGDVLGH 
EFLGEVVTVG PQVRRHRVGD RVVVSSTVAC GSCWQCRSGA PWCCDNGNPA PEASELAYGH 
PVPGAFGRPT ATGGFAGGHA EYVRVPYADV GAYRIPDQVS DDRALFAADA APAGWLAAEL 
GGVRTGSVVA VWGAGAVGQL TARAAGMLGA DRVIVIDPRD DRLRMARRHT DAETIDPRHA 
DVPAELRERT GGRGPDVCVE AVGPAWDGRP RSLADRFTDA AERPPAVREA VHVCRKGGTV 
VVLGEYAGYV DTFPLGAVGA KGLRVRGVRQ HGARHVPTLL ERMARDELRT EHLATHRLPL 
EEGARGYALF RDRRDGCVRA VFSPDLPPAG