Gene Sare_1516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1516
Symbol
ID	5703501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1746335
End bp	1747906
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	71%
IMG OID	641271022
Product	aldehyde dehydrogenase
Protein accession	YP_001536403
Protein GI	159037150
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000142086
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTCTAC GACTCGCAGA TGGGACCGCC AGCTCCGACG TCCTCGACCG CGCGGTGGCC 
GCCGCCCCCG AAGCCTTCGC CGCCCCGATC GACGGCGTCC ACACGCTCCA CAACCTGATC 
GAGGGTGACT GGCGAGCGGT GGGCGTACCA GCCGCGGTGC GCACCCCCAT CGACAACACC 
ATCCTGGTCC GCCTCCCTCG GCTGGACGCA GCGACCGCTC ACGCCGCCGT CGTGCACGCC 
GCGACCGAGC ACCGGGAGTG GGCCGGCACT CCCCTGGCCG ACCGAAAGGC ACGGGTCACC 
GCCGCCCTGG ACGCTCTGAC CGCCCACCGC GACCTCCTTG CCCTGCTCCT CGTCTGGGAG 
ATCGGCAAGC CGTGGCGGCT CGCCGGCGCC GACGTCGACC GGGCGCTCGA CGGCGTCCGG 
TGGTACGTCG ACGAGATCGA CCGGATGCTC GCCGACGGCC GGGAACCGCT TCCCGGACCG 
GTGAGCAACA TCGCCTCCTG GAACTACCCG ATGAGCGTCC TGGTCCACGC CGAGCTGGTG 
CAACTACTCG CGGGGAACGC CGTCATCGCC AAGACCCCGT CGCAGGGTGG CGCGGTCTGC 
CTCACCGTCG CGCACGCGTT GATGCGCCGC GCCGGCCTGC CCGCCACGCT GGTCTCCGGC 
AGCGGTGAGG AACTGTCCGA GGTGCTGGTC CGTGCCCCGG AAGTCGGCGC GGTGGCGTTC 
GTCGGCGGGC GCTCCAACGG CGGGAAGGTG GCGGCAGCGC TACTGGACAC CGACAAGCGG 
CACTTCATCG AGCAGGAGGG GCTCAACGCC TGGGGAATCT GGAACTTCTC CCGGTGGGAT 
CAGCTCGCCG GGCACCTGAA GAAGGGCTTC GAGTACGGCA AGCAACGCTG CACCGCCTAT 
CCGCGCTTCG TCGTGCAGCG GAACCTGGTC GACCAGTTCC TCGACGTGTA CCTGCCGGTC 
GTGCGTTCCG TCCGGTTCGG ACACCCGCTT GCGGTCGAAC ACGACCGGGC CGCCAGTGAC 
CCGCTCCCCG AGTTGGACTT CGGCCCCCTG ATCAGCGCCG CCAAGGCCGA GGAGCTGCGT 
CGCAAGGTCG ACGAGGCGGT CCGTGGCGGT GCGGTCCCGC TGTATCGGGG CCGGCTCGAC 
GGGGCTCCGT TCCTCGACGG GCAGGACACC TCCGCCTACG TGGCACCGTC GGTGCTGCTC 
GCTCCGCCCG GTCGATCCCG CCTGATGCAC GCCGAGCCGT TCGGGCCGGT GGACACGATC 
GTGGTGGTGG ATACCACCGA CGAGCTGCTC GCCGCGATGA ACGCCTCCAA CGGCTCGCTG 
GTCGCCTCGC TCGCCTGCGA CGACGAGGAG GAGGCGGCAA AACTCGCCGT TGACGTGCAG 
GCGTTCAAGG TCGGCATCAA CAAGCCCCGC TCCCGGGGCG ACCGTCAGGA GCCGTTCGGT 
GGTCGTGGCG CCTCCTGGAA GGGGGCCTTC GTCGGCGGTG ACCTGCTGGT GCAGGCGGTG 
ACCGTGGGCG GAGCCGACGA TCGCCTCTAC GGCAACTTCC CGGACTGGAC GGCGCTGCCG 
CCGAACGTCT GA

Protein sequence

MALRLADGTA SSDVLDRAVA AAPEAFAAPI DGVHTLHNLI EGDWRAVGVP AAVRTPIDNT 
ILVRLPRLDA ATAHAAVVHA ATEHREWAGT PLADRKARVT AALDALTAHR DLLALLLVWE 
IGKPWRLAGA DVDRALDGVR WYVDEIDRML ADGREPLPGP VSNIASWNYP MSVLVHAELV 
QLLAGNAVIA KTPSQGGAVC LTVAHALMRR AGLPATLVSG SGEELSEVLV RAPEVGAVAF 
VGGRSNGGKV AAALLDTDKR HFIEQEGLNA WGIWNFSRWD QLAGHLKKGF EYGKQRCTAY 
PRFVVQRNLV DQFLDVYLPV VRSVRFGHPL AVEHDRAASD PLPELDFGPL ISAAKAEELR 
RKVDEAVRGG AVPLYRGRLD GAPFLDGQDT SAYVAPSVLL APPGRSRLMH AEPFGPVDTI 
VVVDTTDELL AAMNASNGSL VASLACDDEE EAAKLAVDVQ AFKVGINKPR SRGDRQEPFG 
GRGASWKGAF VGGDLLVQAV TVGGADDRLY GNFPDWTALP PNV