Gene Sros_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2219
Symbol
ID	8665501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	2399029
End bp	2400909
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	74%
IMG OID
Product	peptidase S9, prolyl oligopeptidase active site region
Protein accession	YP_003337944
Protein GI	271963748
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.194335
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCCG AGCAGGTCGT CCTGCCGTAC GCCACCTGGC CTTCCCCGAT CTCCAGCACC 
GGGGTGGCCA GGTCCGGGCT GCGCCTGGGA TTCCCGACGG TGGTCGGCGA AGAGGTGTGG 
TGGACCGAGG ACCGCCCCGC GGAGAGCGGG CGGACCACGA TCGCGCACCG GGCCGCCGAC 
GGCACGCACC GCGAGCTGCT GTCGGCGCCG TGGAGCGCCA GGACCCGCGT CCACGAGTAC 
GGCGGGCGCT CCTACGCGGT GGTTCCCGGC GGGGGCGTGG TGTTCGCCAA CCTCGCCGAC 
CAGCGGCTCT ACCTGCTGCC CCCCTGCGCC GAACCCCGGC CGATCACGCC GAGGCCCGAC 
CGGGAGTCCG GGCTCCGCTA CGCGGACATG ATCGTCCACG ACGGGCAGGT CTGGTGCGTC 
CAGGAGCGGC ACCACGACGG CGGCGGGATC AGCCGTTCGA TCGTGTCCGT CCCGCTGGAC 
GGCGGGGACG TGCCGCGGGA GCGGGTCGGC GGGAGCGACT TCTACGCCTG TCTCGCCCTC 
TCCCCCGACG GCGAGCACCT GGCCTACATC TGCTGGGACC ACCCCCGCAT GCCGTGGAAC 
GGCACCGAGC TGCGGATCAC CCGGCTGGCC GACGGCACCT CCTGGACGGT CGGGGGCGGG 
CCCTCCGAGT CGGTGCTCGC CCCGCAGTGG CGCGACGACC GGCATCTCTA TCTGGTCTCC 
GACCGGTCGG GCTGGTGGAA CCTCTACCAG ATCGGCATCG ACGGCACCTC GCCCCGGGCG 
CTCCACCCGG TGGAGGAGGA GTTCGCCGGA CCGCTGTGGC AGCTCGGCGG CCCGCCGTAC 
CGGGTGCTGG CCGACGGGCG GATCGCGGTC CTGCACGGGC GGGGGGACAT GCGGCTGGGC 
GTCCTCGACC CGGACAGCGG CGTGCTGACC GACCTGGACG TGCCCTACGA CGGCTGGGAG 
CAGGTCCTCG CGTCCGACGG GCGCGTCCTG GCCGGGATCG GATACAGCGC GACGGTGCCC 
CGGTCGATCG TCCGCGTGGA CACCGCGACC GGGCGGGCGG AGGAGCTCCG CCGTGACGTC 
GACGAGCTGC CCGACCTCGC CTACCTGCCG CTCGCCCGGA CCGTGGAGAT CGAGGGCCGC 
TCCGGCCGCC GGGTCCACGC GTTCGTCCAT CCGCCGTCGA ACCCGCAGGC CCGGGGCGAC 
GGCGCCCCGC CCTACGTGGT GTTCGTCCAC GGTGGCCCCA CCGGGCGCAG CACCGGCGCC 
CTCGACCTGG AGAAGGCGTT CTTCACCAGC CGGGGCATCG GCGTGCTCGA CCTCAACTAC 
GGCGGTTCCA CCGGCTACGG CCGCGCCTAC CGCGACCGGC TGCGCGGCCA GTGGGGCGTG 
GTCGACGTGG AGGACTCGGT CGCCGCCGCC GAATGGCTGG CCGCCGAGGG CCTGGCCGAC 
CCGGAGCGGA TCGCGATCCG GGGCGGGAGC GCCGGCGGCT GGACGGTCAT GGCCGCCTGC 
TGCGCGTCCG AGGTGTTCGC CGGCGGGGTC TCCTACTACG GTGTGAGCGC GCTCGCCTCG 
TTCGTCGCGA CCACCCACGA CTTCGAGTCC CGCTACATCG AGTGGCTGGT GGGCCCCGAG 
GATCCCGCCC TGTACAGCTC GCGCGAGCCG CTCGGCCAGG TCGCCGGGGT GAGCTGTCCC 
ATGCTCCTCC TGCAGGGGCT GTCCGACCCG GTGGTCCCCG CCGCCCAGTC TCAGGCCTTC 
GCCGACGCCC TCGCCGAACG CGGCGTGCCG TGCACCTACC TCACGTTCGA GGGCGAGGCC 
CACGGCTTCC GCCGCGCCGA GACCCGCAGC GCGGCTCTGG CCACCGAGCT CGCCTTCTAC 
CAGCAGATCT TCCGGAGCTG A

Protein sequence

MSPEQVVLPY ATWPSPISST GVARSGLRLG FPTVVGEEVW WTEDRPAESG RTTIAHRAAD 
GTHRELLSAP WSARTRVHEY GGRSYAVVPG GGVVFANLAD QRLYLLPPCA EPRPITPRPD 
RESGLRYADM IVHDGQVWCV QERHHDGGGI SRSIVSVPLD GGDVPRERVG GSDFYACLAL 
SPDGEHLAYI CWDHPRMPWN GTELRITRLA DGTSWTVGGG PSESVLAPQW RDDRHLYLVS 
DRSGWWNLYQ IGIDGTSPRA LHPVEEEFAG PLWQLGGPPY RVLADGRIAV LHGRGDMRLG 
VLDPDSGVLT DLDVPYDGWE QVLASDGRVL AGIGYSATVP RSIVRVDTAT GRAEELRRDV 
DELPDLAYLP LARTVEIEGR SGRRVHAFVH PPSNPQARGD GAPPYVVFVH GGPTGRSTGA 
LDLEKAFFTS RGIGVLDLNY GGSTGYGRAY RDRLRGQWGV VDVEDSVAAA EWLAAEGLAD 
PERIAIRGGS AGGWTVMAAC CASEVFAGGV SYYGVSALAS FVATTHDFES RYIEWLVGPE 
DPALYSSREP LGQVAGVSCP MLLLQGLSDP VVPAAQSQAF ADALAERGVP CTYLTFEGEA 
HGFRRAETRS AALATELAFY QQIFRS