Gene Sros_3160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3160
Symbol
ID	8666448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3440697
End bp	3441962
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	72%
IMG OID
Product	peptidase M20
Protein accession	YP_003338848
Protein GI	271964652
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.119571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGG TCGCGCAGAT CTGCTCGGAC CTGATCAGGT TCGACACCAC CAACCCCGGC 
TCCGGCGAGC GCCCGGCAGC CGAGCACGTC GCCGGACTGC TGTCCGACGC GGGAATCGAG 
CCGACGGTCT TCGAGTCGGC CAGGAACCGC ACCAGCGTGG TCGCCAGGAT CCCGGGCGAC 
TCCCCCGAGG CCCTGCTCAT CCACGGCCAC CTGGACGTGG TCCCGGCCGA GCCCGCCGAC 
TGGCAGGTGC ACCCGTTCTC CGGCGAGGTC GCCGACGGCT GCGTCTGGGG CCGGGGCGCG 
GTGGACATGA AGGGCACGCT GTCGATGACG CTCGCCCTGG TCCGCGACTG GGCCCGGCGC 
GGCGTGCGGC CCAAGCGCGA CATCGTGCTG GCCTTCCTCG CCGACGAGGA GGCCACCGGC 
GAGTACGGCT CGCGGTACGC GGCGACGCGG CACCGGGAGC TGTTCGACGG CTGCACCGAG 
GCGATCAGCG AGTCCGGCGG CTACAGCGTC CAGGCCCCGG ACGCGCGCAT CTACCCCGTC 
GCGGTGGGCG AGCGCGGCAC CGCCTGGATG AAGCTCACCG CCCACGGCGT CGCGGGCCAC 
GGCTCCCGGC CGCCGAAGGA CAACGCGGTG GCCGAGCTCT GCCACGCCCT GTCGAGGATC 
GCCTCCTACC AGTGGCCGGT ACGGCTGACG CCCGGGGTGG CGGCGCTGAT CGCCGGCCTG 
GCGGACATCC TCGGCGAGAA AATCGACTAC GACCGCCTGG AGGAGGAGGC CGAGCGGCTC 
GGCCAGGCGG GCGCCCTGTT CAAGGCGCAG ATCCGCAACT CGGCCAACCC GACGATGCTG 
GAGGCGGGCT ACAAGGTCAA CGTGGTCCCC GGCACCGCGA CCGCGCACGT GGACGGCCGC 
TTCCTGCCCG GTTACCGGGA GGAGTTCCTG GAGACGATCG ACCGCCTGCT CGGCCCCAAG 
GTCACCCGCG AGTTCGTCAA CATCGAGGAC GCCCCCTCGG CGCCGCTGGA CGCGCCGTTC 
TTCGGCCAGC TCTGCGACGC GCTCGTCGCC GAGGACCCGG CCGCGCGGCC GGTGCCGTAC 
GTGATGTCGG GCGGCACGGA CGCGAAGTCC TTCGCCGACA TCGGCATCAA GGGCTACGGC 
TTCGCACCGC TGATGCTCAG CCCGGAGCTG GACTACTACG GCATGTTCCA CGGCGTGGAC 
GAGCGGGTCC CCGTCGAGGG GCTGGAGTTC GGCATGCGCG TCCTGGACCG TCTCCTCGCC 
TCCTGA

Protein sequence

MNEVAQICSD LIRFDTTNPG SGERPAAEHV AGLLSDAGIE PTVFESARNR TSVVARIPGD 
SPEALLIHGH LDVVPAEPAD WQVHPFSGEV ADGCVWGRGA VDMKGTLSMT LALVRDWARR 
GVRPKRDIVL AFLADEEATG EYGSRYAATR HRELFDGCTE AISESGGYSV QAPDARIYPV 
AVGERGTAWM KLTAHGVAGH GSRPPKDNAV AELCHALSRI ASYQWPVRLT PGVAALIAGL 
ADILGEKIDY DRLEEEAERL GQAGALFKAQ IRNSANPTML EAGYKVNVVP GTATAHVDGR 
FLPGYREEFL ETIDRLLGPK VTREFVNIED APSAPLDAPF FGQLCDALVA EDPAARPVPY 
VMSGGTDAKS FADIGIKGYG FAPLMLSPEL DYYGMFHGVD ERVPVEGLEF GMRVLDRLLA 
S