Gene Nmul_A1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1761
Symbol
ID	3783961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2011558
End bp	2012607
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	57%
IMG OID	637811847
Product	beta-hexosaminidase
Protein accession	YP_412450
Protein GI	82702884
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCTCG GTCCCGTCAT ACTCGATATC GAAGGCACGC AACTCACCGC CAACGATAAG 
AAAAAACTCC GGCACCCGCT GGTTGGAGGG GTGATCCTGT TCACGCGCAA CTATTCCTCG 
CTTGCGCAAC TCATGCATCT GACTGCTGAA ATCCATGCGC TGCGAACGCC GCCACTCCTG 
GTCGCCGTCG ATCACGAAGG AGGCAGAGTT CAACGTTTCC GGGAAGATTT CACGCGCCTG 
CCCCCCATGC GAGAACTGGG CAGGATCTGG GATGAGCATC CTGCCCAGGC GCGGCATCTG 
GCGCATGAGG CGGGATATGT CCTGGCGGCG GAACTACGGG CTGCGGGCGT GGACTTCAGT 
TTTACACCGG TCCTGGATAT GGATTATGGC CAAAGCAGCG TCATCCGCGA CCGTGCTTTT 
CACCGTGACC CGCAAGCCAT TGCCGAGCTG GCCCATAGCC TGATGAGCGG GTTGAAATCA 
GCCGGAATGG CAGCGGTGGG CAAACATTTC CCTGGTCATG GTTATATCGA GGCCGATTCC 
CATTTCGAAA TGCCGGTGGA CGAACGAACT TACGCGCAGA TCGAAATGGA CGATCTTATT 
CCATTCCGTA AAATGATCGG TTTCGGCCTT ACCGGCATGA TGCCTGCCCA CGTCATTTAT 
CCAAAGGTGG ATGCATTACC GGCCGGTTTT TCCGAAGTAT GGCTCAAAAA GGTTTTGCGG 
GGTGAGCTGG GTTTCGAAGG GTGTATCTTC AGCGACGATC TGAATATGGC GGGAGCAGCT 
TTTGCAGGCA ATCCGGTGGA GCGGGCCCAG AAAGCATTGC ATGCGGGATG CGACATGGTG 
CTTCTGTGTA ATAACCCGGA AGCGGCCGAA ATGCTGCTCG CGGAGCTACA TTGGGACCTG 
CCCGCCCTTG GGGTGATTCG TCTCGCCCGC ATGCGCGGGC GCCCAAACCC GGATTCGCTG 
GTGAAACTGC ACGAAAACCC GAACTTCGTC AGTGCCGTGG AAAAAATTGC GGGTATCGGC 
GTTCGCAGCG GCGAGTTGCC GCTGGTGTAG

Protein sequence

MSLGPVILDI EGTQLTANDK KKLRHPLVGG VILFTRNYSS LAQLMHLTAE IHALRTPPLL 
VAVDHEGGRV QRFREDFTRL PPMRELGRIW DEHPAQARHL AHEAGYVLAA ELRAAGVDFS 
FTPVLDMDYG QSSVIRDRAF HRDPQAIAEL AHSLMSGLKS AGMAAVGKHF PGHGYIEADS 
HFEMPVDERT YAQIEMDDLI PFRKMIGFGL TGMMPAHVIY PKVDALPAGF SEVWLKKVLR 
GELGFEGCIF SDDLNMAGAA FAGNPVERAQ KALHAGCDMV LLCNNPEAAE MLLAELHWDL 
PALGVIRLAR MRGRPNPDSL VKLHENPNFV SAVEKIAGIG VRSGELPLV