Gene Sros_8103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8103
Symbol
ID	8671431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8929796
End bp	8930977
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	70%
IMG OID
Product	Cell wall-associated hydrolase (invasion- associated protein)-like protein
Protein accession	YP_003343501
Protein GI	271969305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG ACCGCGGATC GCTGACCGAC AGGGACGGCG ACAGGGAACC GATCACTCCC 
GTCGTCCCGG GCAGCTCGGA ACTGCTCACC ATCGCCATGA AGGTCAACGG CGCGAAGGAC 
TCGATCACCA CGATCGCCAA GCGGTGGCGG ACCACCGCGG GCAACCTGAA CGACCACGCC 
ATCGAGCTCA CCCGCGCGGT GAACACGGTG GACCACTCCT GGCAGGGCGA CTCAGCGGAC 
GCCTTCGACG ACTACATGCG CAAGTACCGC AAGGCCGGCG ACGCGCTGCA TGTCGCTCTC 
ACCGACTGCG CGGGCGCGCT CGACACCGCC GCCGGCGCGC TCGACACCGC CGAGACCAAG 
GTGAAGACCC TCACCGAGAA CCTCGTCACC GAGTGGAACA CCTACCGCAC CAACAACAGC 
AAAAACGCCG ACGGCTCCAC CAGGACCGAG GCGGAACTCG CGGCGGGGAT CAAACCGTCG 
GTCGACACGG CCGTCTCCAA CGCCCGCCTC CAGCTCGACA ACGCCGACAA GGCCGTCACC 
AAGGCGACGA CCGACCTGAA GAAGTACATG GACGAGCGGT CGATCCACTT CAGCGACATC 
CCCGCGGTCG GCGACCAGAA GTTCATGGCG CCCGACCGCG TCCTCCACTG GGAGAAGACC 
CCTCTGGCCA ACCCGGGACA GACGACGCTC GCCGGCACGA ACGGCGGCAA CGGCGGCAAC 
GGCGGCAACG GCGCGAGCCT TTCCGGGAGC GGCGGCTCCG GCGGCAACGG CCCGGCGGGC 
GGCGATCCGG GCGGCCCCGC GCAGGCGCTG CCGTACGTAC CGGGGTCCGG GAGCGGAGCC 
GCGATCGTGG CCGCCGCGCA GAAACACATC GGGAAACCCT ATGTCTGGGG CGCCGACGGG 
CCGTCGGCCT TCGACTGCAG CGGGCTCGTC TACTACACCC TGAACCAGGC CGGAATCAAG 
ATCGGCGACA CCACCGCCGC CGGCTACCAG GCGAGCGGGC AGCCCATCAC GCCCCCGCCG 
CAGCCCGGGG ACATCGTGTT CTTCGGGGAT CCCGCGACCC ACGTCGGGAT CTACGCCGGC 
GAGGGCAAGA TGATCCATGC GCCTCGCCCG GGAACGATGG TCAGGGTGGA GGACGTGGCG 
GGGGCGGCGG CGGGGCCCAT CACCTACCGG CGTTTCACGT GA

Protein sequence

MSDDRGSLTD RDGDREPITP VVPGSSELLT IAMKVNGAKD SITTIAKRWR TTAGNLNDHA 
IELTRAVNTV DHSWQGDSAD AFDDYMRKYR KAGDALHVAL TDCAGALDTA AGALDTAETK 
VKTLTENLVT EWNTYRTNNS KNADGSTRTE AELAAGIKPS VDTAVSNARL QLDNADKAVT 
KATTDLKKYM DERSIHFSDI PAVGDQKFMA PDRVLHWEKT PLANPGQTTL AGTNGGNGGN 
GGNGASLSGS GGSGGNGPAG GDPGGPAQAL PYVPGSGSGA AIVAAAQKHI GKPYVWGADG 
PSAFDCSGLV YYTLNQAGIK IGDTTAAGYQ ASGQPITPPP QPGDIVFFGD PATHVGIYAG 
EGKMIHAPRP GTMVRVEDVA GAAAGPITYR RFT