Gene Sare_2081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2081
Symbol
ID	5706801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2393198
End bp	2394313
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	72%
IMG OID	641271567
Product	saccharopine dehydrogenase
Protein accession	YP_001536938
Protein GI	159037685
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.484567
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCA TCACGACGAT CGGCGTTCTC GGCGGCTATG GAGCCGTTGG TAGCGCGGTC 
GTGCGCCGTC TGCACCAGAG CACGGCCGCC TTACTCCTCG TTGCCGGACG AGACCTCGGC 
CGGGCTGAGA AACTCGTCCG CTCCTTGGAT GCGAACGGCG CCCTTGCCGA GCCGGTGGCG 
GCCGACCTTG CTGATCCGGC CGCGCTCGAC CGACTCGCGG CCCGGTGTGA CCTCCTCGTC 
AACTGCGCCG GTCCGTCGTA CCGGGTTCTT GACACGGTCG CCCGAGCGGC GCTGCGCAAC 
GGCGCCGACT ACGTCGACGC CGCCGGCGAC GATCCCACCT TCCTGCGTCT GACCACCGAC 
GGCGGCGCGC GCGAGTGGCA GGCAGCCGGG CGGGTCGCCC TGCTGTCGGC CGGGGCTCTC 
CCAGGGCTGT CCGGGCTCCT GCCGCGCCAC CTGGCCACCA CCGTCGGACG GGCCAGCCGG 
CTCGACGCCT ACCTTGGCGG AGTGGCACCG CTGTCCCCGG CAGCGGCCGG GGACGTACTG 
CTCAGTCGCG GGCCCGAACA CGGCACACCC GGGGCCGGCT GGCGGGACGG CGTCGTCCGC 
GAACGCAGCC TCGAGCCCCG CCGCCGGCTG TCGCTTGCCG CGTTCCCCCG ACCAGTGGAT 
GCCTTTCCCT TCTTGGCCAC CGAGGCCGTC CGACTCGCTC GCGCGCTCCA GATCGGCGAG 
GTCAACTGGT ACACCGCCTT CGGCGGCGGC CGGCTTCCCG AGCAACTGGC ACTATCCTGG 
GCCCTCGACG ACACGGACAC ATCCGAGGTC GTCAACGCGG CGGCCGAGGA CGTACGGCGC 
CACGGCACGT GGTATGGCCA GGAGTTTCAC CTCTGGGACG GGAACGCCGC CGAGACGCCG 
CCGCGGGTCC TGTCGCTGGC CTGCGAGGAC TCCTACGAAC TCAGCGGATT CATGGCCGCC 
GCGGCGGCGA CCGCCGTCCT CGTGGGCGAG ACGCCCGCAG GAGTGCACTT CGCGGCCGAC 
GTGCTCATAC CCACCGAGAT CTTCCAGGCG CTCGCCGTGG ATCCAGCAGC GACGATCAGC 
CTTGACGGAC CGGGCGTGCC GGCTCTGCCA CAGTGA

Protein sequence

MSRITTIGVL GGYGAVGSAV VRRLHQSTAA LLLVAGRDLG RAEKLVRSLD ANGALAEPVA 
ADLADPAALD RLAARCDLLV NCAGPSYRVL DTVARAALRN GADYVDAAGD DPTFLRLTTD 
GGAREWQAAG RVALLSAGAL PGLSGLLPRH LATTVGRASR LDAYLGGVAP LSPAAAGDVL 
LSRGPEHGTP GAGWRDGVVR ERSLEPRRRL SLAAFPRPVD AFPFLATEAV RLARALQIGE 
VNWYTAFGGG RLPEQLALSW ALDDTDTSEV VNAAAEDVRR HGTWYGQEFH LWDGNAAETP 
PRVLSLACED SYELSGFMAA AAATAVLVGE TPAGVHFAAD VLIPTEIFQA LAVDPAATIS 
LDGPGVPALP Q