Gene Sros_4989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4989
Symbol
ID	8668283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5507210
End bp	5508814
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	70%
IMG OID
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003340532
Protein GI	271966336
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.171054
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCCGA TCCCGGCGCC TTCCCGCTGC ACACTCGGAG AAGGGCGGTT CACCTTCACC 
GCCGCGACGC CGTTGACCGC CGACCCGGTG CTGGCCGGCG CCGCGACGTG GCTCCGCCAG 
GCCCTCACCC CGGCTACGGG TCTACCGCTG CTCGAAGGCC CCGGCGGGGT CGAGATCCGC 
CACGCCGTGG GCCTCGGGCC CGAGGAATAT CGGCTCACCG TCACGACGGA GTCCGTGCTG 
ATCGAGGCCT CGGCCCAGGC CGGTGCCTTC TACGGGGCGC AGACTCTTCG CCAGCTGCTC 
GACCCGGCCG CCTTCCGCAC CGGCCGTACC GGAGACAGAA CCTGGAGCAT CCCCGCGATC 
GAGATCGCCG ACGCCCCCAA GTACGGCTGG CGCGGCTGCC TCATCGACGT CGCGCGGCAC 
TTCCTGCCCA AGAACGACCT GCTGAGATAC ATCGACCTGC TGGCCGCGCA CAAGCTCAAC 
GTCCTCCATC TGCACCTGAC GGACGATCAG GGCTGGCGGT TGGAGATCAG GAAGTACCCG 
AAGCTCACGG AGATCGGCGC CTGGCGGCGC GAGTCCCCGC TGGGAGCCAA GCAGCATCGC 
CTGTTCGACG GGCGCCCGCA CGGCGGCTTC TACAGCCAGG ACGACATCAG GGAGATCGTC 
TCCTACGCCG CCGACCGCTC CGTCACGATC GTCCCGGAGA TCGACCTTCC CGGCCACACT 
CAGGCTGCCA TCGCCGCCTA CCCCGAGCTC GGCAACCTCG ACGTCCCCCT GGAGGTGCGC 
ACCGAGTGGG GCGTCGGCGA GAACGTGCTC AACGTCTCCG ACGACACGAT CGCCTTCTTC 
ACCGACGTCC TCGACGAGGT CCTCGAACTC TTCCCCGGCG AGTACGTCTG CGTCGGCGGC 
GACGAGACCC CCAAGACACA GTGGAACGAG AGCGTTCCCG CCAAGGAGCG CATCCGTGAC 
CTCGGCCTGC GCGACGCCGA TGAGCTGCAG AGCTGGCTCA TGCGGCACTT CACCGACTAC 
CTGCTGGCGC GCGGGCGCAA GCCGCTCGGC TGGGACGAAC TCCTGGAGGG TGGCCTGCCG 
CTGGGCGTCA CCGTCGCCGC CTGGCGCGGC GACAGGTGCG CGGCGATGGC CGCGCGAGCC 
GGCCACGACG TTGTCGTCTC CCCGTTCGCC GAGACGTACC TGGATTTCCG CCAGGCGGAG 
GGCGATCAGG AGCCGGTGCC GATCGGCAGC GTGACCTCCC TGCGCGCTGT CCACGCCTTC 
GATCCGGTTT CCCCTGGCCT CACCGGGGAG GAGCGGAGCA GGATCCTCGG CGCGCAAGCG 
GCGCTGTGGA CCGAGCACAT CGACTCGCCC CGGCTCCTCG ACTACATGGC CTTCCCGCGA 
CTGGCCGCCT TCGCCGAGGC GATGTGGAGC GACGAGCGCG ACTTCGAGGA CTTTCTCGTA 
CGGCTCGCCG TACACGAAAA GCGGCTCGAC GCCCTGGGTG TGGAATATCG TCCGGCCGCC 
GGTCCGCACC CCTGGCAGCA ACGCCCTGAT GCTCCCGGCC ATCCCCGGAC CAGGGCCGAG 
ATCGACCGCG TGCTCGCCGG CTGGACCTCC AGCCTGCGGC CCTGA

Protein sequence

MIPIPAPSRC TLGEGRFTFT AATPLTADPV LAGAATWLRQ ALTPATGLPL LEGPGGVEIR 
HAVGLGPEEY RLTVTTESVL IEASAQAGAF YGAQTLRQLL DPAAFRTGRT GDRTWSIPAI 
EIADAPKYGW RGCLIDVARH FLPKNDLLRY IDLLAAHKLN VLHLHLTDDQ GWRLEIRKYP 
KLTEIGAWRR ESPLGAKQHR LFDGRPHGGF YSQDDIREIV SYAADRSVTI VPEIDLPGHT 
QAAIAAYPEL GNLDVPLEVR TEWGVGENVL NVSDDTIAFF TDVLDEVLEL FPGEYVCVGG 
DETPKTQWNE SVPAKERIRD LGLRDADELQ SWLMRHFTDY LLARGRKPLG WDELLEGGLP 
LGVTVAAWRG DRCAAMAARA GHDVVVSPFA ETYLDFRQAE GDQEPVPIGS VTSLRAVHAF 
DPVSPGLTGE ERSRILGAQA ALWTEHIDSP RLLDYMAFPR LAAFAEAMWS DERDFEDFLV 
RLAVHEKRLD ALGVEYRPAA GPHPWQQRPD APGHPRTRAE IDRVLAGWTS SLRP