Gene Sare_3901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3901
Symbol
ID	5705839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4441498
End bp	4442424
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	70%
IMG OID	641273326
Product	acetaldehyde dehydrogenase
Protein accession	YP_001538683
Protein GI	159039430
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4569] Acetaldehyde dehydrogenase (acetylating)
TIGRFAM ID	[TIGR03215] acetaldehyde dehydrogenase (acetylating)

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.59815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGTCG GGGTGGCAGT GCTCGGTTCC GGGAACATCG GAACCGACTT GATGATCAAG 
GTTTTGCGAC TCAGCGACAG CCTGCGGATG GTCGCCATGG CGGGCATCGA TTCGGGCTCC 
GACGGGCTGG CCCGAGCCCG GCGGCTCGGT GTCACCACGA CCGCCGACGG GGTGGCGGGG 
CTCGTGACGT TGCCCGAGTT CGCCGACGTG GAGTTGGTCT TCGACGCCAC GTCGGCCGGG 
GCCCACCGGC ACCACGACTC CGTGCTGCGT GCCTACGGTC GGATCGTGGT CGACCTGACC 
CCCGCCGCGA TCGGGCCGTA CGTGGTGCCG CCGGTCAATC TCGACGAGCA CCTGGCGGAG 
ACCAACGTCA ACATGGTCAC CTGTGGTGGG CAGGCGACCG TGCCGATCGT CGCCGCCATC 
GGCCGGGTCA CCCCGGTCGC GTACGGGGAG ATCGTCGCCT CGATCGCCTC GAAATCCGCC 
GGGCCAGGCA CCCGGGCCAA CATCGACGAG TTCACCGAGA CCACCGCCCG GGCGATCGAG 
GTGGTCGGTG GTGCCGATCG GGGCAAGGCC ATCATCGTGC TGAACCCGGC CGACCCGCCG 
CTGCTGATGC GGGACACCGT GTACTGCCTC TGCCCGGACA CCGACGCGGA CCGGAGCGCG 
ATCATCGCCG CGGTCACCGA CATGGTGGGC GCTGTGCAGG AGTACGTCCC CGGCTACCGG 
CTCAAGCAGG AGGTGCAGTT CGACCGGGTG GACAGCTACC TGCCGGCGCT CGGTGGGCAC 
CTCACCGGCC TACAGGTCTC GGTTTTCCTG GAGGTCTCCG GTGCCGGGCA CTACCTGCCC 
GAGTACGCCG GGAACCTGGA CATCATGACC TCGGCCGCCC TGCGTACCGC AGAGCGGCTG 
ATCGGCCGGC GGGCGGTGAC GGCATGA

Protein sequence

MSVGVAVLGS GNIGTDLMIK VLRLSDSLRM VAMAGIDSGS DGLARARRLG VTTTADGVAG 
LVTLPEFADV ELVFDATSAG AHRHHDSVLR AYGRIVVDLT PAAIGPYVVP PVNLDEHLAE 
TNVNMVTCGG QATVPIVAAI GRVTPVAYGE IVASIASKSA GPGTRANIDE FTETTARAIE 
VVGGADRGKA IIVLNPADPP LLMRDTVYCL CPDTDADRSA IIAAVTDMVG AVQEYVPGYR 
LKQEVQFDRV DSYLPALGGH LTGLQVSVFL EVSGAGHYLP EYAGNLDIMT SAALRTAERL 
IGRRAVTA