Gene Sare_0895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0895
Symbol
ID	5704230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1004812
End bp	1006317
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	68%
IMG OID	641270413
Product	aldehyde dehydrogenase
Protein accession	YP_001535803
Protein GI	159036550
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0385997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGCT TTGACGCGCC CACCCACTGG CAGTCCCGCT ACGACCACTT CATCGGCGGC 
GACTACGTCA AGCCGCACGG CGGGCGGTAC TTCGAGAATC CGACCCCGGT GACCGGGCAG 
CCCTTCTGTG AGGTGGCCCG GGGCACCGCC GAGGACGTGG AGCGGGCCAT CGAGGCCGCG 
CACGGCGCCG CCGGGGCGTG GGGGCGTACC CCAGCTGCCG AGCGCGCCCT GGTCCTCAAC 
CGGGTCGCCG ATCGGATGCA GGAGCACCTG CAGGCGCTCG CGATCGCGGA GACCTGGGAA 
AACGGTAAGC CGGTACGCGA GACGCTGGCC GCCGACATCC CGCTCGCGAT CGACCACTTC 
CGATACTTTG CCGGCGTGAT CCGGGCCCAG GAGGGCTCCC TCGCCGAGCT CGACGATGAC 
ACCGTCGCCT ACCACTTCCA CGAGCCGCTC GGTGTGGTCG GGCAGATCAT CCCGTGGAAC 
TTCCCGCTGC TCATGGCGAC CTGGAAGCTC GCGCCGGCAC TCGCGGCCGG CAACGCGGTG 
GTGCTCAAGC CCGCCGAGCA GACGCCCGCG TCGATCCACT ACTGGCTGTC CCTGGTGGCC 
GACCTACTAC CACCGGGTGT GGTCAACGTC GTCAACGGCT TCGGAGTCGA GGCGGGCCGG 
CCCCTGGCCT CCTCGCCGCG GGTGGCCAAG GTGGCGTTCA CCGGTGAAAC CACGACCGGG 
CGGCTGATCA TGCAGTACGC CAGCGAGAAC ATCAAGCCGG TCACGCTGGA GTTGGGCGGC 
AAGAGCCCGA ACATCTTCTT CGACGACGTC AGCGCCGCGG CCGACGACTT CCGCGACAAG 
GCACTCGAGG GTTTCACGAT GTTCGCCCTG AACCAGGGCG AGGTGTGCAC CTGCCCGTCC 
CGGGCGCTGA TCCAGCAGGG GCACTACGCC GACTTCCTGG CGGCGGCAGT CGCGCGGACC 
CGCGAGATCA CGCCGGGGCA CCCGCTGGAC ACCGCGACGA TGGTCGGCGC GCAGGCGTCC 
AACGACCAGC TCGAGAAGAT CCTTTCCTAT CTGGACATCG GTCGGCAGGA AGGTGCCCGC 
GTGTTGGTCG GTGGCGCGCG GGCGGAGCTG GGCGGCGAGT TGTCCGGCGG GTACTACGTC 
GAACCGACGA TCTTCGAGGG CAACAACTCG ATGCGGATCT TCCAGGAGGA GATCTTCGGC 
CCCGTCGTGT CGGTCACCTC CTTCGCCGAC CTCGACGACG CGATCAAAAT CGCCAACGAC 
ACGTTGTACG GGCTCGGTGC TGGCGTCTGG ACCCGGGACA TCAACACGGC CTACCGGGCG 
GGGCGGGCCA TCCAGGCGGG GCGGGTCTGG ACGAACTGTT ACCACGCGTA CCCAGCGCAC 
GCCGCGTTCG GCGGGTACAA GCACTCCGGG ATCGGCCGGG AGAACCACAA GATGATGCTG 
GATCACTACC AGCAGACCAA GAACCTGCTG GTCAGCTACT CCCCGAAAAA GCTGGGCTTC 
TACTGA

Protein sequence

MTRFDAPTHW QSRYDHFIGG DYVKPHGGRY FENPTPVTGQ PFCEVARGTA EDVERAIEAA 
HGAAGAWGRT PAAERALVLN RVADRMQEHL QALAIAETWE NGKPVRETLA ADIPLAIDHF 
RYFAGVIRAQ EGSLAELDDD TVAYHFHEPL GVVGQIIPWN FPLLMATWKL APALAAGNAV 
VLKPAEQTPA SIHYWLSLVA DLLPPGVVNV VNGFGVEAGR PLASSPRVAK VAFTGETTTG 
RLIMQYASEN IKPVTLELGG KSPNIFFDDV SAAADDFRDK ALEGFTMFAL NQGEVCTCPS 
RALIQQGHYA DFLAAAVART REITPGHPLD TATMVGAQAS NDQLEKILSY LDIGRQEGAR 
VLVGGARAEL GGELSGGYYV EPTIFEGNNS MRIFQEEIFG PVVSVTSFAD LDDAIKIAND 
TLYGLGAGVW TRDINTAYRA GRAIQAGRVW TNCYHAYPAH AAFGGYKHSG IGRENHKMML 
DHYQQTKNLL VSYSPKKLGF Y