Gene Sros_3301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3301
Symbol
ID	8666589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3595107
End bp	3596330
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	70%
IMG OID
Product	putative serine protease
Protein accession	YP_003338983
Protein GI	271964787
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.44867
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGA CGCTCCTCAC AGCTCTCTTC GCAAGTTCCC TCGCTATGAC GGCGATTCCG 
GCCACGGCCG CGATCGCCGC CGCACCGGAC CCTGTCAGCA ACTACATCGT CGTCCTGCAG 
GACGGCACGG ACCCCTCGGC CTTCGCCGGC ACCCAGGCAC GTTCCCGTGG CGCCGCGGTG 
GACAAGATCT TCAACCACGC GCTCCGCGGC TACTCGGCGA AGATGAGCGC CACCGCGGCC 
GCCGCCGTCG CCCGCGACCC GCAGGTGCAG TTCGTGCAGC CTGACGGGGT GGTGTCGATC 
AGCGCCCAGA CGCTGCCCAC AGGGGTCAAC CGGGTCGACG CCGAGCTCAG CCCCACCGCC 
GCCATCAACG GCGTGGACAC GCGGGTCAAC GTCGACGTGG CGATCATCGA CACCGGCATC 
CAGCTCACCC ACCCCGACCT GAACGTCTAC ACCGCGGGGG CCAAGAACTG CAACACCGGC 
ACGAGCGCCA ACGACGGCCA CGGCCACGGA ACACACGTGG CGGGCACGGT CGGGGCGCTG 
GACAACACCA GCGCCGTCGT CGGCGTGGCA CCTGGCGCCC GCCTGTGGCC GGTGCGCGTG 
CTGAACAACA GCGGCGGCGG CAGCTGGTCG CAGGTGATCT GCGGCATCGA CTACGTCACC 
GCCCACGCCT CCGAGATCGA GGTCGCGAAC ATGAGCCTCG GCGGCCTCGG CGCCGACGAC 
GGCAACTGCG GCAACACCAA CAACGACGCC ATGCACCGGG CGATCTGCGC CGCCGTCGCG 
GCGGGCGTGA CCTTCGTGGT CGCGGCCGGC AACGAGACCG ACAACGCGGC CAACCACGTG 
CCCGCGGCGT ACGACGAGGT CATAACGGTC AGCGCGCTGG CCGACTTCAA CGGGCTTCCC 
GGTGGCGGGG CGGCGTCCAC CTGCCGCAGC GACGTCGACG ACACGTTCGC CAGCTTCTCC 
AACTACGGCG CCGACGTGGA CATCATCGCC CCGGGCGTGT GCATCCTGTC CACCTGGAGG 
AGCAGCGGCA CCAGCACCAT CTCGGGCACC TCGATGGCCA GCCCGCACGT TGCCGGTGGA 
GCGGCCCTCT ACAAGGCCAC GCATCCGGCG GCGACGCCGG CGGCGGTGAA GTCCGCGCTC 
CAGGCGGCGG GCACCACCAA CTGGAACAAC GCCGACGACC CTGACGGCAT CAAGGAGAAG 
CTGCTCAACG TCGCCACCTT CTGA

Protein sequence

MRKTLLTALF ASSLAMTAIP ATAAIAAAPD PVSNYIVVLQ DGTDPSAFAG TQARSRGAAV 
DKIFNHALRG YSAKMSATAA AAVARDPQVQ FVQPDGVVSI SAQTLPTGVN RVDAELSPTA 
AINGVDTRVN VDVAIIDTGI QLTHPDLNVY TAGAKNCNTG TSANDGHGHG THVAGTVGAL 
DNTSAVVGVA PGARLWPVRV LNNSGGGSWS QVICGIDYVT AHASEIEVAN MSLGGLGADD 
GNCGNTNNDA MHRAICAAVA AGVTFVVAAG NETDNAANHV PAAYDEVITV SALADFNGLP 
GGGAASTCRS DVDDTFASFS NYGADVDIIA PGVCILSTWR SSGTSTISGT SMASPHVAGG 
AALYKATHPA ATPAAVKSAL QAAGTTNWNN ADDPDGIKEK LLNVATF