Gene Sros_1165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1165
Symbol
ID	8664440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1188555
End bp	1189688
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	73%
IMG OID
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_003336906
Protein GI	271962710
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.816168
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA CACTCGCCGA CGCCCGCATC GTGACCCCCG AAGGTGTCCA CGGAGGCTGG 
CTCACCATAG AAGACGGCCG CATCACCCAC ATCGGCCAGG GGTCCGCGCC CGGACCCGGC 
CACAGCCTCG CGGGCCGGTA CGTCGTGCCG GGATTCGTCG ACATCCACAA CCACGGCGGG 
GCGGGCGGCT CCTTCCCCAC CGGCGATCCG GACCAGGCGA GCCGGATCGC CGCCCTGCAC 
GCCCGGCACG GCACCACCAC CCTCATGGCC AGCCTGGTCA CCGCGGCCCT CGACGACCTG 
GCCGGGGCGA CCTCCGCCCT GGCCGACCTG TGCGAGGACG GCCTGCTGGC CGGCATCCAC 
TTCGAGGGCC CCTACATCTC CAAGGCCCGC TGCGGCGCGC ACAACCCGGC GCTGCTCCGC 
GAGCCCTCCC CGCGGGAGTT CGGCGACCTG CTCAGGGCCG GGCGCGGCCA CGTGCGGATG 
CTCACCATCG CCGCCGAGCT GCCCGGCGCG CTGGACACCA TCCGGGAGGC GGTCGCGAAC 
AACGTGATCG CCGCGCTCGG GCACAGCGAC GCCACCTACG AGCAGACCAT CGCGGGCATC 
GACGCGGGCG GCAGCGTCGC GACCCACCTC TACAACGCGA TGCCGCCGCT GCACCACCGC 
GACCCCGGCC CGATCGCCGC CCTGCTGCAG GACGAGCGCG TCACGATCGA GCTGATCAAC 
GACGGCGTGC ACCTGCACCC GGCGATGATG CGCCTGGCCT ACGACGTCGC GGGGCCCGGC 
CGTACCGCGC TGATCACCGA CGCCATGGCG GCGGCCGGCA TGGGCGACGG CGTCTACGGG 
CTCGGCCCGA TGAAGGTCGA CGTCGTGGAC GGCGTCGCCC GGCTGGCCGA GGGCGGCTCC 
ATCGCGGGCA GCACCCTGAC CATGGACGTC GCGTTCCGGC GCAGCGTCCA GCAGGTCGGG 
CTGTCGCTGC CGGAGGCGGC CGAGGTCGCC TCGCTCACCC CCGCCCGGGT GCTCGGCCTC 
GCCGACCGCC TCGGCTCCGT CTCCGTCGGC AAGCAGGCCG ACCTGGTGGT GCTCACCGGC 
GACCTGGAGG TCGCCGGTGT CATGAAGCAC GGAAACTGGA TCACAGAACC CTGA

Protein sequence

MSITLADARI VTPEGVHGGW LTIEDGRITH IGQGSAPGPG HSLAGRYVVP GFVDIHNHGG 
AGGSFPTGDP DQASRIAALH ARHGTTTLMA SLVTAALDDL AGATSALADL CEDGLLAGIH 
FEGPYISKAR CGAHNPALLR EPSPREFGDL LRAGRGHVRM LTIAAELPGA LDTIREAVAN 
NVIAALGHSD ATYEQTIAGI DAGGSVATHL YNAMPPLHHR DPGPIAALLQ DERVTIELIN 
DGVHLHPAMM RLAYDVAGPG RTALITDAMA AAGMGDGVYG LGPMKVDVVD GVARLAEGGS 
IAGSTLTMDV AFRRSVQQVG LSLPEAAEVA SLTPARVLGL ADRLGSVSVG KQADLVVLTG 
DLEVAGVMKH GNWITEP