Gene Sros_9094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9094
Symbol
ID	8672440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10031957
End bp	10033225
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	73%
IMG OID
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003344460
Protein GI	271970264
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.121755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCATTC CGCGGCCGCA GGAACAGGCC GTCCTCGGGG GCTCCGCCGC GTTCCGGCCG 
GACGACCTAC GGCTGGCGCC CGACGACCCG TCCCTCGGCG AGGAGGGCTA CCGCCTCGAC 
GTCACCCCCG GGGGCGTCGA GCTGACCGCC GGAGGACCGG CCGGCCGGTT CTACGGTTCG 
AAGACCCTCT CCCAGCTCGG GCCGCTGGTG CCGTACGGGA CGATCGAGGA CCGGCCGAGG 
TTCGCCTGGC GCGGGGTCAT GCTCGACGTC GCCCGCCACT TCATGCCCAA GGCGTTCGTG 
CTGCGCCTCA TCGACCTGCT CGCCGAGCAC AAGCTCAACG TCCTGCACCT GCACCTGACC 
GACGACCAGG GCTGGCGGCT GGAGATCAAG CGCCATCCCC GGCTCACGGA GGTGGGCGCG 
CGGCGCGGCG GGTTCTACAC GCACGACGAC ATCCGCGAGA TCGTCGCTTA CGCGGCCGAC 
CGGTTCGTCA CCGTGGTGCC CGAGATCGAG ATGCCCGGCC ACGCCCAGGC CGCCGTCGCC 
GCCTACCCCC TGCTGGGCAA CGATCCCTCC CGGGACCTGC AGGTCTGGTC GGAGTGGGGG 
ATCAGCGAGC ACGTCCTGAA CCTGGAGGAG TCCACGATCC GCTTCTGCCA GGACGTGCTC 
GACGAGGTCG TCGGGCTGTT CCCGGGCAGG TACGTGCACG TCGGCGGCGA CGAGTGTCCC 
GTCACCGAGT GGGAGCGCAG CCCCGGGGCG CGGCGGCGGC TGGCGGAGCT GGGGCTGCGA 
CCGCGGGACG CGTGCGCCTG GTTCATCGGC CGGATGGCCT CCCACCTGGA GAGCCACTCG 
CGCGAGCTGG TCTGCTGGGA CGAGCCCGAC CGCGAGCCCA CCCCCGGCAC GACCGTCATG 
GTGTGGCGGG ACGAGCAGGC CGACCGGGGA GACAACGACG TCATCCTGGC GCCGCACACG 
CGGACCTACT TCGACTACCG CCCGTCGGCC GACCCGGGCC ACCCGCCCGC CCAGGAACGC 
GTCCTCACCC TGGCCGACAC CTACGCCTTC GCGCCCGACC CGGCCGCGCG CGGCGTCCAG 
TGCCAGCTCT GGACCGAATA CATGCCCACC CCCGAGCAGG TCGAGTACAT GGCCTTCCCC 
CGGATGTGCG CCTTCGCGGA GGTCGCCTGG GGATCGCCCG GCGACTATCC CGACTTCCTC 
CTGCGGCTCG ACGCCCACCT CGCCCGGCTG AGCGCCCGGG GCGTCCGCGT CGGCCCGCTC 
GTCCCATGA

Protein sequence

MIIPRPQEQA VLGGSAAFRP DDLRLAPDDP SLGEEGYRLD VTPGGVELTA GGPAGRFYGS 
KTLSQLGPLV PYGTIEDRPR FAWRGVMLDV ARHFMPKAFV LRLIDLLAEH KLNVLHLHLT 
DDQGWRLEIK RHPRLTEVGA RRGGFYTHDD IREIVAYAAD RFVTVVPEIE MPGHAQAAVA 
AYPLLGNDPS RDLQVWSEWG ISEHVLNLEE STIRFCQDVL DEVVGLFPGR YVHVGGDECP 
VTEWERSPGA RRRLAELGLR PRDACAWFIG RMASHLESHS RELVCWDEPD REPTPGTTVM 
VWRDEQADRG DNDVILAPHT RTYFDYRPSA DPGHPPAQER VLTLADTYAF APDPAARGVQ 
CQLWTEYMPT PEQVEYMAFP RMCAFAEVAW GSPGDYPDFL LRLDAHLARL SARGVRVGPL 
VP