Gene Sare_0897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0897
Symbol
ID	5704232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1007836
End bp	1009275
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	73%
IMG OID	641270415
Product	aldehyde dehydrogenase
Protein accession	YP_001535805
Protein GI	159036552
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0403101
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGTCCG TAGCCTTCCA TGTCGCAGCC CGCCCCGCCC ACGGTGAGCA GGAGCTGACC 
GTGCACCATC CGTACGACGG GCGCGTCGTC GGGCGTACCA CTTTCGCCAC CCCGAACCAG 
GTCGAGACCG CCGTCGCGGC CGCTGCCGCG GTGGCCCCGA CGGCCGCTGC CCTGCCCGCG 
TACCTGCGGG CGGCGGCCCT GGACCACGTC CATCGGCGTC TCGCCCAGCG CGCCGACGAG 
GTGGCGGCGC TGATCACCGC CGAGAACGGC AAGCCGATCA AATGGGCGCG CGCCGAGGTG 
CGGCGGGCAA TAGGTACGTT CCGGTGGGCC GCCGAGGAGG CTCGGCGTTT CTCCGGGGAG 
TTGCAGCGTC TGGACACCGA TCCGGCCGCC GCCGGCCGGC TGGCGTTGGT CCGCCGGGTG 
CCGCGGGGCC CCGTGCTGGG AATCTCCCCG TTCAACTTCC CGCTGAACCT GGTGGCGCAC 
AAGGTCGCGC CGGCGATCGC GGTCGGTGCA CCGATCATCG TCAAACCGGC CCCGGCCACC 
CCGCTGTCCG CGTTGCTGCT CGGTGAGCTG CTGGCCGAGA CCGACCTGCC GGAGGGCATG 
TTCTCGGTGC TGCCGCTGCC CAACGAGCGC GCCGCCGGGC TCGTCGCCGA CCCGCGGCTG 
CCGGTGGTGT CGTTCACCGG CTCCGGTCCG GTGGGCGCGG CCATCCGCCG GTCGGTGCCG 
GACAAGCACG TGACCCTGGA GTTGGGCGGC AACGCGGCGG TGGTGATCTG TGCGGACTGG 
AGCGCCGAGG AGGACCTGAC CTTCGCCGCG GACCGGATCG CGACCTTCGC GAACTACCAG 
GCCGGCCAGT CCTGTATCGC GGTGCAGCGG GTGTACGTGC ACGAGTTCCT CTACGACGGC 
TTTCTGCCCC GGCTGGTCGC GGCGGTGCGG GAGTTGCGGA CCGGTGACCC CTCGTCCGAG 
TTGACCGACG TCGGTCCGCT GGTCTCCGAG GTGGCCGCCC GCCGGGTCGA GGAATGGGTG 
GACGAAGCCG TTGCGGCGGG CGCCACCATC GAGGTCGGCG GTCGCCGGGA GGGCGCCACG 
TTCCCGCCCA CGGTGCTGTC CGGGGTGCCG CGGGACGCCA GGGTCAGTGC CGAGGAGGTG 
TTCGGGCCGG TGCTGGTGGT AGCCAGGGCG GGCAGCGACG ACGCCGCGTT CGCGGCGGTC 
AACGATTCGG CGTACGGGTT GCAGGCGGGC GTCTTCACCC ACCGGCTGGA CACGGCGTTC 
CGCGCCGGAC AGGCCCTGGA GGTGGGCGGG GTGATCGTCG GGGACGTGCC GTCGTACCGC 
GCCGACCAGA TGCCGTACGG CGGGGTGAAG GCATCCGGCG TCGGACGGGA GGGCGTACGC 
AGCGCGATGG ACGACTACAC CGAGCCGCGC GTCCTGGTCC TCACCGGCGT CACCGGGTAG

Protein sequence

MESVAFHVAA RPAHGEQELT VHHPYDGRVV GRTTFATPNQ VETAVAAAAA VAPTAAALPA 
YLRAAALDHV HRRLAQRADE VAALITAENG KPIKWARAEV RRAIGTFRWA AEEARRFSGE 
LQRLDTDPAA AGRLALVRRV PRGPVLGISP FNFPLNLVAH KVAPAIAVGA PIIVKPAPAT 
PLSALLLGEL LAETDLPEGM FSVLPLPNER AAGLVADPRL PVVSFTGSGP VGAAIRRSVP 
DKHVTLELGG NAAVVICADW SAEEDLTFAA DRIATFANYQ AGQSCIAVQR VYVHEFLYDG 
FLPRLVAAVR ELRTGDPSSE LTDVGPLVSE VAARRVEEWV DEAVAAGATI EVGGRREGAT 
FPPTVLSGVP RDARVSAEEV FGPVLVVARA GSDDAAFAAV NDSAYGLQAG VFTHRLDTAF 
RAGQALEVGG VIVGDVPSYR ADQMPYGGVK ASGVGREGVR SAMDDYTEPR VLVLTGVTG