Gene Sros_5196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5196
Symbol
ID	8668490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5711128
End bp	5713212
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	68%
IMG OID
Product	V8-like protein Glu-specific endopeptidase-like protein
Protein accession	YP_003340713
Protein GI	271966517
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.710887
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.178037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATAC AGGAAAAAGT CCAGGAATTG GGTTTAGGCC ATGCGCAGGC CGCTGCCGAC 
CGGTATCGCC AAAGTGACGG AGCCCGGGAG GAGGTTGAGC GACGGCGGGA TCAGGGCGCG 
GTCTTCCCCG ACTCGCCGGA GGCGCTCGCG GCCCGCATCA CTCGCCTTAT CCAGCGGAAC 
GGAGTGCCGG TCGAGGCGGT GCTGGAGACC ACCCGGGCCG AGTCCTTGGA CCTCCCCGAG 
ATGCGCGAGC GTATTCTGGG GATTTCCAAG GATCTGCAGG CATGGAGCTT CCTGCCCCGT 
GGTGCCCGTG CCGCTCGGAC CGTCGCGCGG ATCTCGGTCA GCGAAAACGG CCGTGAACTA 
CCCGTCGGCA CCGGCTTCCT GGTGTCGCCG AGGTTGCTGC TGACCAACCA CCATGTATTC 
CCCGACGTCG AGGCGGCGCA CCGGGCCTTC GTGGAGTTCG ACGCTCAGGT CACCATCGAC 
AACACCCCGG AGCCGGCCAA ACGTTTCCGC CTGGATCCGG ATACCTTCTT CGTCGCCGAC 
CAGGACCTGG ACTTCGCCTT GGTCTTGGTC GGCGCCGATG CCGCAGGCCG GCTCGCGGGT 
GAGACGTTCG GCTGGAACAG GCTCAGTGTC CAACTGGGCA AACTGGTCAT CGGAGAATCA 
GTCAACATCA TCGGCCACCC CCGTGGCCGG TTGAAGGAGA TCTCCATCCG CGAGAATCGG 
CTGGAGAACC GTTGGGATGA CTTCATCCAC TATCGGACCG ACACCGAGCC CGGCAGTTCC 
GGCTCCCCGG TCTACAACGA CCAGTGGGAA GTGACGGCGC TCCATCACAG CGGCGTGCCT 
AAAACCGACA GCCAAGGCCG TATCCTGCGA CGGGACGACC GGGTTTGGCA GCCCGGCGAC 
GGTGACGACG CCATTGAATG GATCTCCAAC GAGGGCGTGC GCATCAGCGT CATCCTCAAG 
CATCTGGCCA CGCTGCCGCT CGATGACAGC CGCCGGGCGT TCCTGACCGA GATGGGTCCG 
GAGTCCGGGC TTCAGGACGG TGGCGCCCCG CAACCGGCCG TCGCGGGATC CGGTGCGCCC 
TTCGCCGCAC GCCCGCTCGC CGAACCAGCC GTCGAGGTCG TCACGGACCT GGCCGCGACA 
CGACCTTCGA CTACCCCGGC GGCTGACGTC CGTCGCGGCC TGACCGCCGG CGCGGCCGCG 
TTCGGTGGTG CCCGGCACCT GGTCTTCCTG CACGGCCGCG CTCAGCAGGG ACGTGACCCT 
GAGCGGCTGC GCCGATACTG GACCGCCGGA TTGAACGGCG GGCTCACCCG CGCAGGGCTG 
GCTACGATCG AACCAGCCGA TGTCTGGTGG CCCTTCTACG GCGACAGGCT TGTTCAGGCC 
CTGCAACCCC GTGAGGCGAT CTTCCGCTCG CTGGAGCGGC TCGTCGATCC GGCAGCGGTC 
ATCGCGCCGG ACTCCGACGC CGCCCGGCGG CTGTACGAGC AGCTGATCAC CGAGGCCGCC 
ACCCAAGCAG GCATGCCCGC CGAAGCCCCG ACCTCCCTGG AAGGGCTGGA CCGGACGGCC 
GACGCCGTGC ACCGGGGACT GAGCTGGCTG GCCGCCACCA CCAGCCTGGA CCGGCTGACC 
ATCGCCACCT TCTTCACAGA CGTCGCCGCC TACCTCGGTG ACCCACAAGT TCGCGAGACG 
GTCTTGGACT GCGTGCTCCA AACGATGCCC GCGACCGGCA CATTGGTGCT GGTCAGCCAT 
AGCCTGGGCA CGGTCGTCGC CATGGACCTG CTCACCCGGC TTGATCTCGG AGTCGACGTC 
GAGCTTCTCG TCACCGCCGG CAGCCCATTG GGCATGGACG GCGTGTACCG CCACCTGCTC 
ACCGGCGGCC CCAAACGCCC CGAACGGGTG GCCCATTGGT TCAACGCCTG GTGCCCGATC 
GATCCGGTCA CCATCGGGTG CCCTCTGGGC GACCACTGGC AGGGAGAGCT GGCCGAAACC 
CCCGTCACCA ACCCCGCCGG CCGAACCCAC GACATCGAGG AGTATCTCGG CCACCCCGAG 
GTCGCCCAAG TGATCGGTGC CCGGCTGTTC GGAGCCAGGC CTTGA

Protein sequence

MNIQEKVQEL GLGHAQAAAD RYRQSDGARE EVERRRDQGA VFPDSPEALA ARITRLIQRN 
GVPVEAVLET TRAESLDLPE MRERILGISK DLQAWSFLPR GARAARTVAR ISVSENGREL 
PVGTGFLVSP RLLLTNHHVF PDVEAAHRAF VEFDAQVTID NTPEPAKRFR LDPDTFFVAD 
QDLDFALVLV GADAAGRLAG ETFGWNRLSV QLGKLVIGES VNIIGHPRGR LKEISIRENR 
LENRWDDFIH YRTDTEPGSS GSPVYNDQWE VTALHHSGVP KTDSQGRILR RDDRVWQPGD 
GDDAIEWISN EGVRISVILK HLATLPLDDS RRAFLTEMGP ESGLQDGGAP QPAVAGSGAP 
FAARPLAEPA VEVVTDLAAT RPSTTPAADV RRGLTAGAAA FGGARHLVFL HGRAQQGRDP 
ERLRRYWTAG LNGGLTRAGL ATIEPADVWW PFYGDRLVQA LQPREAIFRS LERLVDPAAV 
IAPDSDAARR LYEQLITEAA TQAGMPAEAP TSLEGLDRTA DAVHRGLSWL AATTSLDRLT 
IATFFTDVAA YLGDPQVRET VLDCVLQTMP ATGTLVLVSH SLGTVVAMDL LTRLDLGVDV 
ELLVTAGSPL GMDGVYRHLL TGGPKRPERV AHWFNAWCPI DPVTIGCPLG DHWQGELAET 
PVTNPAGRTH DIEEYLGHPE VAQVIGARLF GARP