Gene Sros_8159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8159
Symbol
ID	8671487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8998001
End bp	8999128
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID
Product	alkaline D-peptidase
Protein accession	YP_003343553
Protein GI	271969357
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.533807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCACA ACATCCACGA GAAGATCCAG CAGATCCTGA ACCGGGCTGT GGCCGAGGAC 
GGCGTTCCCG GCATCGTCGC CGAAGTTCAC GACGCCGACG GAACATGGTT CGGCGCCGCA 
GGAGTGGCCG ACCTCGCCGG CGGGCATCGG CGTCAGCCCG GGGAGCACCT GCACATCGGC 
AGCTCCGGTA AGGCCTTCAC CGCCGCCACC GTGCTGGCCC TGGCAGCCGA AGGCAGGCTG 
AGCCTCGAGG ACCCGGTGAA CACATGGCTG CCCGGCGTCA TGGAGACGGG CGGCTACGAC 
GGCGACAAGA TCACCATCCG GCATCTGCTC AACCACACCA GCGGCCTGTT CCTCACCGGC 
CTCGCACCAG AACTACAGCG CAGCATCGCC ACGCAGCCGA CCCGCATCTG GACCACCTCC 
GAGCTGGTGA GGCTCGCGGT GTCCCAGCCG CCGGCCGGCG AGCCGGGCGA GCAGTTCATC 
TACTCCAACG GCGGCTACTA CCTGGCCGGC GCGATCATCG AGAAGGTCAC CGGCAACACC 
TACGCCGCCG AAGTCGAACG CACAGTCATC CGGCCGCTCG ACCTGACCCG CACCTACGTA 
CGGCCCGCAG ACGCCACAAG CTATCTCCAC CCGCATCCCA CGGCCTACGT TGCCGGCGCC 
CTCAAGGATG GCGTCGACCC GGCGACGCTC ACCGCGGAGA ACTGGGCGTC GATGATCGAC 
CATGACAAGC CGCCCATCGA CGTCACCGCG CTCAACACCT CATGGGGCTG GGCGGCCGGC 
GGCATCGTCT CCACCACCGA AGACCTGACC CGCTTTCTCA GGGCGATCGC GACCGGCGGT 
CTGCTGCCAC CGGCTCAGCA CCACGAGATG TGGACCATGG TCACCAACGA CAGCGTCGTC 
TGGTTGCCGC ACGCCCGCTA TGGCCTCGGC GTGATCGAGT TCGACAACGC GGGGATGGAC 
GGCCTGACCG TGCGTGGCGT CAGCGGCACC CTCCCGGGAT CCTTCACCCT CGCGCTGAGC 
ACCGACGACG GCCGGCAGAG CGTCGTCATC CACACCAACA TCGAGCCGAA GACCTTGGAC 
ATCCCCATCA AGATCATCAA GGCGATGTAC GGCGTCGCCC TCGGCTGA

Protein sequence

MPHNIHEKIQ QILNRAVAED GVPGIVAEVH DADGTWFGAA GVADLAGGHR RQPGEHLHIG 
SSGKAFTAAT VLALAAEGRL SLEDPVNTWL PGVMETGGYD GDKITIRHLL NHTSGLFLTG 
LAPELQRSIA TQPTRIWTTS ELVRLAVSQP PAGEPGEQFI YSNGGYYLAG AIIEKVTGNT 
YAAEVERTVI RPLDLTRTYV RPADATSYLH PHPTAYVAGA LKDGVDPATL TAENWASMID 
HDKPPIDVTA LNTSWGWAAG GIVSTTEDLT RFLRAIATGG LLPPAQHHEM WTMVTNDSVV 
WLPHARYGLG VIEFDNAGMD GLTVRGVSGT LPGSFTLALS TDDGRQSVVI HTNIEPKTLD 
IPIKIIKAMY GVALG