Gene Sare_3883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3883
Symbol
ID	5706380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4425600
End bp	4426580
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	641273308
Product	alcohol dehydrogenase
Protein accession	YP_001538665
Protein GI	159039412
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.014306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.116687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAA TCCGCTTTTA CGCGTACGGC TCGTCCAAAG TCCTCACCCT CCAGGACCTC 
GACAAGCCCG CCGTCGGTGA CGACGACGTG CTGGTCCGGG TGCGGGCGGC TTCGGTCAAC 
GTCGTGGACT GGCACACCAT GAGGGGTACG CCGTACATCA TGCGGGCGCG GGGTGGGATG 
TCCCGCCCCA AGGTCAACGA GCTGGGCTTC GACCTGGCCG GGCAAGTCGA AGCGGTGGGC 
AGGAACGTCA CCACCCTGCG GGTGGGCGAC GAGGTCTTCG GCTGTCAGGA CCTGGAACAC 
GCGGGCGTGT TCGCCGAGTA CGTCACCATT CCCCACGATG CGGGAGTGCT GAAGAAGCCG 
GTCGGGCTGT CCCTGGAACA GGCGGCTTCC GTGCCGGTGG CGGCACTCAC CGCCTACCAG 
GCACTACGTC ACCACGGGCG GCTGCAACCC GGCCACAAGA TCCTGGTCAA CGGTGCGGCA 
GGAGGCGTGG GAACCTTCGC CGTGCAGATC GGCAAGGCGC TGGGCGCCGA GGTAACCGCC 
GTGTGCAGCA CCAGGAACGT CGAGATGGTC CGCGCTCTGG GTGCCGACCA CGTCATCGAC 
TACACCACAG AGGACTTCAC TCACCGCGCG CAACGCCACG ACATCCTCCT CGACAACATC 
GGAAACCACC CGCTCTCCGC ATGCCGGCGC GTGCTCACCC CCCGGGGGAC CCTCGTCCTG 
AACAGCGGCA CGGGAGGCCC ACTACTCGGA CCCCTGGGCC GGGTACTCCG TGGGCTCACC 
CTGTCCTTGT TCGTACGGCA GCGTCTGGTG TTCTTCCTGG CACGCCCCAC CAAGGGCGAT 
CTGGAAGCAC TTCGCGACCT GCTCGAATCC GGGAAGGTCA CCCCGGTCAT CGACCGGACA 
TATCCCCTCA GCGAGCTGCC CAAGGCGATC AGCTACCTCG AGACAGGGCA CGTCCGGGGA 
AAGGTCGTCA TCACCATCTG A

Protein sequence

MKGIRFYAYG SSKVLTLQDL DKPAVGDDDV LVRVRAASVN VVDWHTMRGT PYIMRARGGM 
SRPKVNELGF DLAGQVEAVG RNVTTLRVGD EVFGCQDLEH AGVFAEYVTI PHDAGVLKKP 
VGLSLEQAAS VPVAALTAYQ ALRHHGRLQP GHKILVNGAA GGVGTFAVQI GKALGAEVTA 
VCSTRNVEMV RALGADHVID YTTEDFTHRA QRHDILLDNI GNHPLSACRR VLTPRGTLVL 
NSGTGGPLLG PLGRVLRGLT LSLFVRQRLV FFLARPTKGD LEALRDLLES GKVTPVIDRT 
YPLSELPKAI SYLETGHVRG KVVITI