Gene Sare_1625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1625
Symbol
ID	5703469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1861009
End bp	1862484
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	71%
IMG OID	641271133
Product	aldehyde dehydrogenase
Protein accession	YP_001536508
Protein GI	159037255
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGACC TCTACATCGA TGGGGAGTGG CGGCAGTCGG TGGCCGGCGG CCACCGGGAG 
ATCCGCTGCC CCGCGGACGG CGCTTCGGTG GCCACCGTCG CCGAGGGAAC CCGGGACGAC 
ACGATCGCGG CGATCAGCGC GGCCCGGAAG GCGTTCGACG AGGGGCCGTG GCCCTGGCCG 
AGGACCCCGG CCGGCGAACG CGGTGCCCTG TTGCACCGCG TCGCCGACCT CCTGCAGCGC 
GACAAGCAGG AGTTCGCGCG GGCCGAGTCG CTCGACACCG GCAAGCGGTT GGTGGAGAGC 
GAGTACGACA TCGACGACGT GACTGCCTGC TTCCGGTACT ACGCGAGCAT CGCCGACACG 
GACAGCGGAC GCGTCGTGGA CACCGGGCGC AGCGACGCGA TCAGTCGCGT CGAGTACGAG 
CCGATCGGTG TGTGCGGGCT GATCACGCCC TGGAACTATC CGTTGCTGCA GACCTCGTGG 
AAGGTCGCCC CGGCGCTCGC CGCCGGGAAC ACCTTCGTCC TCAAGCCCAG TGAGCTGACC 
CCCTCGACCG CGATCCTGCT GATGCGGCTG CTGGACGAGG CCGGGCTGCC GCCGGGCGTC 
GCCAACCTGG TCCTCGGCGC CGGTGCCGAG GTCGGAGCGC CGCTCGCCGA GCACCCGGAC 
GTGGACCTGG TCTCGTTCAC CGGGGGTCTG CAGACCGGGC GCGGCCTGAT GGCCGCGGCC 
GCCGCCACGG TGAAGCGGGT GACCCTCGAA CTCGGTGGCA AGAACCCGAA CGTCGTGTTC 
GCCGACGCCG ACTTCGACGC CGCCGTGGAC TTCGCGCTCA CCGCGGTGTT CCTGCACTCG 
GGTCAGGTCT GCTCGGCGGG TACCCGACTG GTGGTCGAGG AGTCCATCCA CGACGCCTTC 
GTCGACGCGG TCGTGGACCG TGCCCGCCGG ATTCGCCTCG GTGGGCCCTT CGACACCACG 
GCGGAGACCG GCCCGCTGAT CTCGGCCGCT CACCTGTCCA AGGTGGAGTC GTACGTCGCC 
GCCGGGATCG CCGAAGGCGC GGTACTGCGC TGCGGCGGTC GTCGCCCCGA CGATCCACGC 
CTCGCCAACG GTTTCTACTA CCTTCCGACG GTGCTCGACG GCTGCCGTGG GGACATGTCC 
GTGGTCCGTG AGGAGTCCTT CGGCCCGGTC CTCACCGTCG AGACCTTCAA CGACGAGGAC 
GAGGCGGTCC GCATCGCCAA CGACACCCAC TACGGCCTCG CCGGTGCGGT GTGGACCAGC 
GACGCCGGCC GCGCCCAGCG CGTCGCGCGG CGGCTGCGCC ACGGCACTGT CTGGATCAAC 
GACTACCACC CGTACGTGCC CAAGGCGGAG TGGGGCGGTT TCCGGCAGTC CGGGAACGGC 
CGCGAGTTGG GCCCGACCGG GCTCAACGAG TACCGAGAGA TGAAGCACAT CTGGCAGAAC 
ACCGATCCCC GTCCGCAGCA CTGGTTCGGC GGCTAG

Protein sequence

MKDLYIDGEW RQSVAGGHRE IRCPADGASV ATVAEGTRDD TIAAISAARK AFDEGPWPWP 
RTPAGERGAL LHRVADLLQR DKQEFARAES LDTGKRLVES EYDIDDVTAC FRYYASIADT 
DSGRVVDTGR SDAISRVEYE PIGVCGLITP WNYPLLQTSW KVAPALAAGN TFVLKPSELT 
PSTAILLMRL LDEAGLPPGV ANLVLGAGAE VGAPLAEHPD VDLVSFTGGL QTGRGLMAAA 
AATVKRVTLE LGGKNPNVVF ADADFDAAVD FALTAVFLHS GQVCSAGTRL VVEESIHDAF 
VDAVVDRARR IRLGGPFDTT AETGPLISAA HLSKVESYVA AGIAEGAVLR CGGRRPDDPR 
LANGFYYLPT VLDGCRGDMS VVREESFGPV LTVETFNDED EAVRIANDTH YGLAGAVWTS 
DAGRAQRVAR RLRHGTVWIN DYHPYVPKAE WGGFRQSGNG RELGPTGLNE YREMKHIWQN 
TDPRPQHWFG G