Gene Snas_5673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5673
Symbol
ID	8886888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	6032757
End bp	6034406
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	70%
IMG OID
Product	UDP-N-acetylglucosamine--lysosomal-enzyme N-acetylglucosamine phosphotransferase
Protein accession	YP_003514396
Protein GI	291303118
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0913502
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGTG TGAACTACAT GTCGTCGAGC CCGGTCGCGT GGGATCCCCC ACTGATCGAG 
GTCCCCACCG TCACCAAGGC CGAACTGACC GGTCTGCCGG TGCGGGGTGT CCGCCACAAC 
TTCGCCGAGT ATCGGGGGCG CGCGCTCGAC GCCGCCGCGC CGCTGGCGGT CCGGCAGCAC 
AACCTGACGC TGGTGAGCGC CGCCTTCGAC GAGGCCGGGG TGCCGTACTT CGCGGTGCCG 
GGACTGGACG ACCTGACCTC CTGCCTGGCC GTGACGCTGA TGGACCGGGA CCGGGCCTGC 
GCGGTGCTGC GGCGGCTGTG CCAGGAGACC GACGGCTATA TGTCGATCCT GCACCCGGTG 
CCGCCGGTGC GGCAGGAGCC GCGCGCGGGT GGCGACAAGG AGGCGTGGGA GCAGGCCGGT 
GACCCACGGG TGGTGCGGCT CAACTGGTAC TGGACCGACC CGGACCACAA GCTCAGCTTC 
GGGCCTGAAC ACGGCTGCGA CGTCGAGTTC TGGCGCCGCG ACGCCAAGGT GCGGCTGATC 
TCGCCGCGCC CCAACCGGGT GACCCGGGTG GTGCCGGTCG ACGGCGCGAG CGTCGAGGTG 
GAGGCGCGCC GGTTCACTCG GCTGCTGGAC GGCGCCGCGA CCACGCTGCC GCCGGTGCGG 
TCGCGACAGG AGTTCTCGCA CACCACCCCC GACGCGGTGG AGTTCCCCGT CGACGTCGTC 
TACACCTGGG TCGACGGCAC CGACGCGGCC TGGCAGCGCC GCCGCGCCGA GTGCTCCGGC 
GAGGTCTACC ACGTCGAGGC GGCCAGCGAC GCGCGCTACA TCAGCCGCGA CGAGCTGAAG 
TACTCGCTGC GCTCGGTGCA CCAGAACGCG CCGTGGGTGC GCAACGTCTA CATCGTCACC 
GACGACCAGA CGCCGCCGTG GCTCAACACC GACGACCCCC GGGTGCGGGT CGTCGACCAC 
CGCGAGATCT TCTCCGACCC GTCGGTGCTG CCGGTGTTCA ACTCGCACGC GATCGAGTCC 
CAGCTGCACC ACATTCCCGG GCTGTCGGAC CAGTTCCTGT ACTTCAACGA CGACATGTTC 
CTGGGCCGTC CGCTCACCCC GCAGCGGTTC TTCGAGGCCA ACGGACTGTC CCGGTTCTTC 
TTCGCGGGCT CGCACGTGCC GCTGGGGCCG ATCACCGAGA ACGACACCCC GGTGGACGCC 
GCCTGCAAGA ACAACCGGGA ACTGTTGCGC GACAAGTTCG GCAAGACGAT CTCGCAGACC 
TTCCAGCACG TGCCGTACCC GCTGCGGCGC GACGTCATGT TCGACATCGA GAAGGACTTC 
GAGGAGGCGC ACCAGCGCAC CGCCGCCAGC CGGTTCCGAG CCCTGACCGA CCTGTCGATC 
CCGTCCTCGT TCCAGCACTA CTACGCGTAC TTCACCGGCC GGGCCACGCC CGGGAAGCTG 
CAGTCGGTGT ACATCCAGCT GGCCGTCGCC GACCTGCGGG AGCGGCTGGA CCGGCTGCTG 
GCCCGCCGCG ACGCCGACGC GTTCTGCCTC AACGACGCCT ACTCGACCCC CGAGGACATG 
GAGCGGCAGA ACTCGCTGCT GCTGCCGTTC CTGGAGTCGT ACTTCCCGGT GCCGTCGCCG 
TTCGAGAAGA ACCCGGGTGC GTCGCCGTGA

Protein sequence

MGSVNYMSSS PVAWDPPLIE VPTVTKAELT GLPVRGVRHN FAEYRGRALD AAAPLAVRQH 
NLTLVSAAFD EAGVPYFAVP GLDDLTSCLA VTLMDRDRAC AVLRRLCQET DGYMSILHPV 
PPVRQEPRAG GDKEAWEQAG DPRVVRLNWY WTDPDHKLSF GPEHGCDVEF WRRDAKVRLI 
SPRPNRVTRV VPVDGASVEV EARRFTRLLD GAATTLPPVR SRQEFSHTTP DAVEFPVDVV 
YTWVDGTDAA WQRRRAECSG EVYHVEAASD ARYISRDELK YSLRSVHQNA PWVRNVYIVT 
DDQTPPWLNT DDPRVRVVDH REIFSDPSVL PVFNSHAIES QLHHIPGLSD QFLYFNDDMF 
LGRPLTPQRF FEANGLSRFF FAGSHVPLGP ITENDTPVDA ACKNNRELLR DKFGKTISQT 
FQHVPYPLRR DVMFDIEKDF EEAHQRTAAS RFRALTDLSI PSSFQHYYAY FTGRATPGKL 
QSVYIQLAVA DLRERLDRLL ARRDADAFCL NDAYSTPEDM ERQNSLLLPF LESYFPVPSP 
FEKNPGASP