Gene Sros_5805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5805
Symbol
ID	8669099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6369031
End bp	6370155
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	73%
IMG OID
Product	peptidase, S1E (streptogrisin A) subfamily
Protein accession	YP_003341294
Protein GI	271967098
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.202302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.468539
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAGTC GAGGCCCCCT CCTGGCCGGA GCCGCCACAG TGGCCCTGTA CCTGGCCGCC 
AGCGTGACAC CCGCCACCGC AGCACCCGCC CCCCTCTCCC CCAAGCCGCC GTCGCCCGTG 
ATCGTCGACG CCCTCCAGCG CGACCTCGGC CTCACCGCCG AGCAGGCCGT GGCGCGGCTG 
GCCAACGAGG AACGCGCCAT GGCCACGGAG TCCACCCTGA GCGGCACGCT CGGCGGCAAG 
TACGCCGGCG CCTGGCTCAA CGGCGACGCC TCCCAGCTCC TCGTCGGCAC CAGCGACGCC 
ACCACGGCCG ACGCCATCAG GGCCCAGGGC GCCCAGCCCG TGATCGTCAG CCGGACCCTG 
GAGCAGCTCA ACGCGGTCAA GGACCGGCTC GACCAGGCTC CGGCCCGGGC CAAGGCCGGC 
GCGTCCCTGT GGTACGTCGA CCTGCCCACC AACAGCGTCG TCGTCCAGGC CGCCCAGCAG 
GCCGGAGGCG AAGCCCTCAT CGCCGCCGCC GGCGTCGACA AGGACGCGGT CCGGGTGGCG 
GTGACCGCCG AACGGCCCCA GCCCTTCATC GACATCATCG GCGGCAACCC CTTCTACATC 
GGCTCCAGCC GCTGCAGCAT CGGCTTCTCC GTGACCAAGG GGAGCACGCC GGGCTTCGTC 
ACCGCGGGCC ACTGCGGCAG GAGGGGCGCC ACGACCACCA ACCCGACCGG CACCTTCCAG 
GGCTCCTCCT TCCCCGGTAA CGACTACGCG TGGGTGGCCG CCCCCGGCAA CACCCCCAGG 
CCGTGGGTGA AGGGGTCCGG CGGCGCCAAC GTCATCGTCC GCGGGTCCAC GCAGGCCGTG 
GTCGGCTCCT CCATCTGCCG CTCCGGCTCC ACCACCGGCT GGCGCTGCGG CACCATCCAG 
CAGCACAACG CCAGCGTGAC CTACCCGCAG GGCACGGTCA GCGGCCTGAC CCGCACCAGC 
GCGTGCGCCC AGCCGGGCGA CTCCGGCGGG TCGTTCATCT CCGGCAGCCA GGCCCAGGGC 
ACGACCTCGG GCGGCTCCGG CAACTGCACC TCGGGCGGCA CGACCTACCA CCAGCCGGTC 
AACGAGCCCC TGTCCGTCTA CGGGCTGACC CTGACCGTCG GCTGA

Protein sequence

MFSRGPLLAG AATVALYLAA SVTPATAAPA PLSPKPPSPV IVDALQRDLG LTAEQAVARL 
ANEERAMATE STLSGTLGGK YAGAWLNGDA SQLLVGTSDA TTADAIRAQG AQPVIVSRTL 
EQLNAVKDRL DQAPARAKAG ASLWYVDLPT NSVVVQAAQQ AGGEALIAAA GVDKDAVRVA 
VTAERPQPFI DIIGGNPFYI GSSRCSIGFS VTKGSTPGFV TAGHCGRRGA TTTNPTGTFQ 
GSSFPGNDYA WVAAPGNTPR PWVKGSGGAN VIVRGSTQAV VGSSICRSGS TTGWRCGTIQ 
QHNASVTYPQ GTVSGLTRTS ACAQPGDSGG SFISGSQAQG TTSGGSGNCT SGGTTYHQPV 
NEPLSVYGLT LTVG