Gene Sros_1431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1431
Symbol
ID	8664706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1493938
End bp	1495221
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	73%
IMG OID
Product	beta-hexosamidase A precursor
Protein accession	YP_003337168
Protein GI	271962972
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.982661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.138036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGCCG GATGTGCCGG CACGGGAGCG GGGGCGACCC CGCCCGCCCG GCAGGCCGCG 
GGGCAGGTCA ACGGCACGGC CACGACCGCC CCCTCGCCGT CCGCGACGTC CGCGGCGTCC 
GCGACCCCGG GGGCCTCCAA GGTGGAGGCC GTGCTCGCGC GGATGAGCGT GGAGGACAAG 
GTCGGGCAGC TCTTCATGCC GGTGCTGTAC GGCTCGGCGG CGGACACGGT GTCGGGGGAG 
AACCAGGCGC GGTTCGGGGT CGGCACCCCG GCCAAGGCGG TCGCCAGATA CCGGCCGGGC 
GGGGTGATCC TGTTCCCCTG GGCGGGCAAC GTCAAGAACG TCCGGCAGGT CGTGGCGCTG 
ACCAACGGGC TGCAGAAGGC GTCGCCGGAG ATCCCGCTGC TGGTCGGCGC CGACCAGGAG 
AACGGCAGGG TCTCCCGGAT GGCCCCGCTG GTCACCGAGA TGCCCGGCGC CTCGGTCATC 
GGCTCGACCG GCGATCCCTC GCTGGCCCGC AAGGCGGCCA AGGTCACGGG CACCGAGCTG 
CGCGCCCTCG GCATCAACCT CGACTTCGCC CCGGTCGCCG ACGTGAACAT CAACCCGCGC 
AACCCGGTGA TCGGCCCCCG GGCCTACGGT TCGGACCCGA AGAAGGTGGC GCCGATGGTC 
GCCGCGGCGG TCCAGGGCTT CCACGACGCC GGCATCGCCA GTACGGCCAA GCACTTCCCC 
GGCCACGGCG ACACCAACGT GGACAGCCAC TCCGGGCTGC CGGTGATCCA GCACTCCCTG 
TCCCAGTGGA ACAAGCTGGA CGCGCCTCCC TTCGCCGCGG CCATCGGCAA GAACATCGAC 
GCGATCATGA GTGCCCACGT GGTCATGCCC AAGCTCGACC CGTCCGGTGA CCCCGCCACG 
CTCTCCAAGC CCATCCTGAC CGGGCTGCTC CGCGAGAAGC TCGGCTTCGA CGGGGTCGTC 
TCGACGGACG CGCTGGACAT GGCGGGGGTG CGCAAGAAGT ACGGGGACGG GCAGGTGGCC 
GTGCGGGCCA TCCAGGCCGG GGTGGACCTG CTGCTGATGC CGCCGGACTT CCCCAAGGCC 
TACGGGGCGG TGCTGGCCGC GGTGAAGTCC GGGAAGATCT CCACCGCGCG GCTCGACCAG 
TCCGTCCGGC GGCTGCTGAA GCTGAAGGCC GCGCGGGGCC TGCTGGACCG GGCGCCGGTC 
GCCGACCCGG CCGAGGCCGA GCGGGTGCTG CGCTCGGCCG AGCACCGCAA GGTCGCCCAG 
CTCATCAACG CGCGGGCCCG CTGA

Protein sequence

MVAGCAGTGA GATPPARQAA GQVNGTATTA PSPSATSAAS ATPGASKVEA VLARMSVEDK 
VGQLFMPVLY GSAADTVSGE NQARFGVGTP AKAVARYRPG GVILFPWAGN VKNVRQVVAL 
TNGLQKASPE IPLLVGADQE NGRVSRMAPL VTEMPGASVI GSTGDPSLAR KAAKVTGTEL 
RALGINLDFA PVADVNINPR NPVIGPRAYG SDPKKVAPMV AAAVQGFHDA GIASTAKHFP 
GHGDTNVDSH SGLPVIQHSL SQWNKLDAPP FAAAIGKNID AIMSAHVVMP KLDPSGDPAT 
LSKPILTGLL REKLGFDGVV STDALDMAGV RKKYGDGQVA VRAIQAGVDL LLMPPDFPKA 
YGAVLAAVKS GKISTARLDQ SVRRLLKLKA ARGLLDRAPV ADPAEAERVL RSAEHRKVAQ 
LINARAR