Gene Sros_9002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9002
Symbol
ID	8672344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9950646
End bp	9952283
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	74%
IMG OID
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003344376
Protein GI	271970180
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.5335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACC TTCTGCCGCG TCCCGCTGTC TTTGCGCCTG CCGACGGCTC GTTCCCGCTC 
TCTCCCGGCA CCCCCGTCTC CGGTCCCGCC GAGCTGGTGG ACGGGGTACG GCTCGCGCTC 
GCCGTGCTTG ATCCGCGGCC GGCGGAGGCG GGAACGATCG TGGTGGAGCG GGACGCGGCG 
CTGGACGCGG AGGCCTACAC GCTGGAGGTG ACGGCCACCG GCGTGCGGAT CACGGCCGGA 
GACCGCGCGG GGGCCTTCTA CGCCGGCCAG ACCCTGCGGC AGCTGCTCCC CCATGGGGCG 
TTCCGGACGG TCGCCCAGGC GGGCTGGACC GTTCCGTGCG GCCGGGTGGA GGACGCGCCC 
CGGTTCTCCT GGCGCGGCGT CCACCTGGAC GTGGCGCGGC ACTTCCTGCC CAAGCGCGAG 
GTGCTGCGGA TGGTCGACCT CATGGCGGCG CACAAGCTGA ACCGGCTCCA TCTCCACCTG 
GTGGACGACC AGGGATGGCG GGTCGAGAGC CGGGTCGCCC CCAGGCTGCA CGAGGTGGCC 
TCGCACCGGC CGCGCACGAT CACCAGCCAC CACAAGGACG ACCCGGTCTA CGACGAGGTG 
CCGCACGGCG GCTACTACAC GCTGGACGAC CTCGCGGAGA TCGCCGCCTA CGCGCGGGCC 
AGGGCCGTGA CCGTCGTGCC CGAGATCGAC GTGCCGGGAC ACGCCTCGGC GATCCTCGCG 
GCCTACCCCT CGCTCGACGC GCGGGCCACC GGCGGCCGGG AGCCCGAGCC CTTCCCCGTG 
CTGGACCGGT GGGGCATCTC CCCCGCGATC CTGTCCCCGC TCCCCCCGAC GGTCGACTTC 
CTGACCTCGG TGATCGACGA GATCCGCGGC GCGCTGGGCG AGACGCCTTA TGTGCACCTC 
GGCGGGGACG AGTGCGTGCT CGACGACTGG GCTGCTTCAG CGGAGATCGT CGCGTTCCAG 
GAGGAGCTCG GCCTGGAGAG CCTGAGCGGC CTGCACGCCT GGTTCCTGCG CCGGCTGGCG 
GACCTGCTGG CCGAGCGGGG CAGCCGGGCG ATCGTCTGGG ACGAGGCGTT CGTCAGCGGC 
ATGCTGCGGC CCGACACGAT CGTGATGCCG TGGCGCGGGC CGGGCGTGGC CCGGCGCGCC 
GCCGAGGCCG GGCACGACGT GGTGCAGACA CCGGTCTTCC CGCTGTACTT CGACTACGCC 
GAGACCTCCT CGGAGGAGGA GCCGCTCGCC ATCGGCGACG CGATCACCGT GTCGGACGTC 
GCGACCTTCG CTCCCGCACC GGAGTCGTGG ACGGCCGAGC AGCGGGAGCA CGTGCTCGGG 
GCGCAGTTCC AGCTGTGGAG CGAGCGCCTG CCCGACGGCC GGGCGGTGGA CTACCGCGCC 
TGGCCGCGAG GCTGCGCGCT GGCCGAGGTC GTCTGGTCCG GCTCGGCCGG GCCCGGATTC 
GGGGAGCGGC TCGAAGGGCA CCTGGGCCGC CTGGACGCGC TGGGGGTCGA GTACCGCCCG 
CCGGCAGGCC CGCGCCCCTG GCAGCTCGGC GGCACCGGGC GCCGCCGCCA CCGCCCGGGG 
GTCGTCAAGG TGGACGAGGT CATGGGGCAC CTGGAGGAGA TGACCCACCT CGCCGACTCC 
ACCCGGCCGA GCATGTGA

Protein sequence

MTDLLPRPAV FAPADGSFPL SPGTPVSGPA ELVDGVRLAL AVLDPRPAEA GTIVVERDAA 
LDAEAYTLEV TATGVRITAG DRAGAFYAGQ TLRQLLPHGA FRTVAQAGWT VPCGRVEDAP 
RFSWRGVHLD VARHFLPKRE VLRMVDLMAA HKLNRLHLHL VDDQGWRVES RVAPRLHEVA 
SHRPRTITSH HKDDPVYDEV PHGGYYTLDD LAEIAAYARA RAVTVVPEID VPGHASAILA 
AYPSLDARAT GGREPEPFPV LDRWGISPAI LSPLPPTVDF LTSVIDEIRG ALGETPYVHL 
GGDECVLDDW AASAEIVAFQ EELGLESLSG LHAWFLRRLA DLLAERGSRA IVWDEAFVSG 
MLRPDTIVMP WRGPGVARRA AEAGHDVVQT PVFPLYFDYA ETSSEEEPLA IGDAITVSDV 
ATFAPAPESW TAEQREHVLG AQFQLWSERL PDGRAVDYRA WPRGCALAEV VWSGSAGPGF 
GERLEGHLGR LDALGVEYRP PAGPRPWQLG GTGRRRHRPG VVKVDEVMGH LEEMTHLADS 
TRPSM