Gene Sros_3887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3887
Symbol
ID	8667177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4331982
End bp	4333142
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	75%
IMG OID
Product	Saccharopine dehydrogenase (NAD(+), L-glutamate- forming)
Protein accession	YP_003339547
Protein GI	271965351
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.011216
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACG ACCGCCCGTA CGACATCGTG CTCTTCGGCG CCACCGGGTT CACCGGAGCG 
CTGACCGCGC AGTACCTCGC GCGCAACGCC AGTCCTGGCT GCCGCTGGGC ACTGGCCGGT 
CGCAGCCGGA CCAAGCTCGA AGCGGTGAGG GAGCGCATCG GCCTGCCCGA GCTGCCGCTG 
CTCCACGCCG ACGCGACGGA TCCGGCCTCC CTGGCGCGGA TCGCCGGGCA GGCCAGGGTC 
GTCGCCACCA CCGTGGGCCC CTACGTCGCC TACGGCGAGC CGCTCGTGGC CGCCTGCGCG 
GCCGCGGGCA CCCACTACGC CGACATCACC GGCGAGCCGG AGTTCGTCGA CCTCATGTTC 
GCCCGGCACC ACGAGAGGGC CAGGCGGAGC GGGGCGAAGA TCGTGCACGC CTGCGGGTTC 
GACTCCATCC CGCACGACCT CGGCGCCTAC TTCACCGTCA ACCGGCTCCC CGAGGGGGTG 
CCGATCGAGG TGAGCGGGTT CCTCCGGGGG AACGGCCGGC CCTCGGGCGG CACCGTCCAC 
TCCGCCCTCG CGGCGGTCTC CCGGGCCCGG CAGACCGCTC GGGCCGCGCT CGCCCGGCGC 
GAGGTCGAGG AGCGCCCCCA AGGCCGGCGG GCGCGTGGCA CCGCCGGACC GCCCCGGTAT 
GTCGGAGGCT GGGCCCTGCC GCTGCCCACG ATCGACCCGC AGATCGTGGC GCGCTCGGCC 
CGCGCGCTGG AGCGCTACGG CCCCGACTTC ACCTACCGCC ACCACATCGC CGTCAGGCGG 
CTGCCCGCCG CGCTGGGGCT CGTGGCGGGC GCGGGCGCCC TCGTCGCGCT CGCCCAGATC 
CCCCCGGTCC GCTCCTGGCT GCTCGGCCGG ATCTCGCCCG GTGACGGACC CACCCCCGAG 
CAGCGGGCCG GGAGCTGGTT CAAGGTCACC TTCCTCGGCC TGGGTGGCGG CGAGCGCGTC 
GTCACCGAGG TCGCGGGCGG CGACCCCGGC TACGACGAGA CCGCCAAGAT GCTCGCCGAG 
TCGGCGCTCT GCCTCGCCCT CGACGACCTG CCGCCGGTCT CCGGCCAGGT CACCACGGCC 
GTGGCGATGG GAGACGCGCT GATCGAGCGG CTCCGGCGGG CGGGCATCAC CTTCACCGTG 
CTGAGCGGCC CGCCGAAGTA G

Protein sequence

MSDDRPYDIV LFGATGFTGA LTAQYLARNA SPGCRWALAG RSRTKLEAVR ERIGLPELPL 
LHADATDPAS LARIAGQARV VATTVGPYVA YGEPLVAACA AAGTHYADIT GEPEFVDLMF 
ARHHERARRS GAKIVHACGF DSIPHDLGAY FTVNRLPEGV PIEVSGFLRG NGRPSGGTVH 
SALAAVSRAR QTARAALARR EVEERPQGRR ARGTAGPPRY VGGWALPLPT IDPQIVARSA 
RALERYGPDF TYRHHIAVRR LPAALGLVAG AGALVALAQI PPVRSWLLGR ISPGDGPTPE 
QRAGSWFKVT FLGLGGGERV VTEVAGGDPG YDETAKMLAE SALCLALDDL PPVSGQVTTA 
VAMGDALIER LRRAGITFTV LSGPPK