Gene Sare_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2101
Symbol
ID	5704715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2421657
End bp	2422679
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	70%
IMG OID	641271586
Product	alcohol dehydrogenase
Protein accession	YP_001536957
Protein GI	159037704
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0244583
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAG CCGTCATTCC CGAATTCAAC GGCACCTGGG AACTACGTGA GGTGCCGACG 
CCGGTGCCGG GGCCGGGCGA AGTCCTGATC CGGGTACGTG CCTCTGGTGT CTGCTACAAC 
GACTTCCTCG CCACCTGCGG TGGAATTCCG TTCCCGACGG TCAGCCCGGC GGTCACCGGA 
CACGAGCCGG TCGGCGAGGT GGCCGAGGTG GGGCCTGACG TCACGTCTCG GCAGGTCGGT 
GATCGGGTCG GGGCCACCTG GGTCCGGGCA GGCTGCGGGC GGTGCGACTA CTGCCAGCGC 
AACCTGCCGG TGTCCGGCCA GACCGCGATC AACTGCCCGT CGCCGACCAC CACCGGCTTC 
AGTGTGCTGG GCGGGCATGC CGAATACCTG GTCACCAGGG CCGACGAAAC CGTGCTCATC 
CCGGACGGGC TCCCCTTCGA ACTCGCCGCA CCAGTGATGT GCGCCGGGTA CACGGCCTGG 
TCGGCGCTGC GTGCGGCGAA CCCGCTGCCG CACGAGCGGG TCGCGGTTCT CGGCATCGGC 
GCCCTCGGCC ACCTGGCGGT GCAGTTCGCC CGGGCCACCG GGTTCGAGAC CGTCGCCATC 
ACCCGGTCGG TGGACAAACA CGACGCCATC CGCCGGCTCG GCGCCGACCA CATCGTCGGC 
AGCGGCGAGG AACTGCGGGA ACTGGGCGGA GCCGACGTCA TCCTGGCTAC CTCACCGTCC 
TACGCTGCGG CCGGTGCAGC CCTGCAAGGG CTGCGGGTCA ACGGACGAAT GGTGCTCGCC 
GGCATCGACG GACAGGAGCC ATTCACCATC CCGGCAGCGG TGACGTACCC GTTCTTCGCG 
CTGGGGCAAC GCATCATCAG CGCGACCCAC GACGGCCCCC GGTACCTCAC CGAGGCGCTG 
AACCTTGTGG CATCCGGGAA GGTCGCACCG GTGGTGGAGA GGTTCCCCGC CGAGCGGGTC 
GCCGAAGCCG TCGCCAAGGT GGCCAAGGGC GACGTCCGGT TCCGCGCCGT GGTCACGTAC 
TGA

Protein sequence

MKAAVIPEFN GTWELREVPT PVPGPGEVLI RVRASGVCYN DFLATCGGIP FPTVSPAVTG 
HEPVGEVAEV GPDVTSRQVG DRVGATWVRA GCGRCDYCQR NLPVSGQTAI NCPSPTTTGF 
SVLGGHAEYL VTRADETVLI PDGLPFELAA PVMCAGYTAW SALRAANPLP HERVAVLGIG 
ALGHLAVQFA RATGFETVAI TRSVDKHDAI RRLGADHIVG SGEELRELGG ADVILATSPS 
YAAAGAALQG LRVNGRMVLA GIDGQEPFTI PAAVTYPFFA LGQRIISATH DGPRYLTEAL 
NLVASGKVAP VVERFPAERV AEAVAKVAKG DVRFRAVVTY