Gene Namu_0188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0188
Symbol
ID	8445768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	211807
End bp	213225
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	71%
IMG OID	645039335
Product	beta-galactosidase
Protein accession	YP_003199610
Protein GI	258650454
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	71
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTA CGCCGCGCAC ATTCCCCGAG GACTTCTTGT GGGGGTCGGC GACCGCGTCG 
TACCAGATCG AGGGAGCGGT CACCGAGGAC GGCCGCGGGC CGTCGATCTG GGACACCTTC 
AGCCACACCC CCGGCAAGAC GATGAACGGC GACACCGGTG ACGTCGCCGA CGATCACTAC 
CACCGGTGGT CCGCCGACCT GGACCTGATC AAGGGGCTGG GCCTGCAGGC CTACCGGTTC 
TCGCTGGCCT GGCCGCGGAT CCAGCCGACC GGGTCCGGGG CGGTCAACGC CAAGGGCGTC 
GACTTCTACT CGCGGCTGGT CGACGGTTTG CTCGAGCGCG GGGTCAAGCC CGTCGTCACG 
CTGTACCACT GGGACCTGCC GCAGGCCCTG GAGGACGAGG GCGGCTGGAC GAACCGGGAC 
ACCGCGTTGC GGTTCGCCGA CTACGCCGCG CATGTCGCCG GAGCGCTCGG GGACCGGGTG 
GAGATGTGGA CGACCCTGAA CGAGCCATGG TGCTCGGCGT TCCTGGGCTA TGCCTCGGGC 
GTGCACGCGC CGGGCCGCAC CGATGGGGAG GCGGCGCTGC GGGCGGCGCA CCACCTGAAC 
CTGGGCCACG GGCTGGCCGG CCGGGCGGTG CGCGAGGTAC TCGGGGCCGA CACCAAGTTG 
TCGGTGACGC TGAACCTGCA CGTGACCCGG CCGGTCGACC CGGACTCGGC CGCCGACCGG 
GACGCGATCC GGCAGCTGGA CGCGGTCGGC AACCGGGTCT TCCTGGGTCC GATGCTGGAC 
GGCGCCTACC CGGCCGACCT GCTGGCCGAC ACCGCGTCGG TCACCGACTG GTCGTTCGTG 
CGGGACGGCG ACGAGGCCGC CTGCGCGGTC CCGATCGACG TGCTGGGCAT CAACTACTAC 
TCGACCTCCC GGGCTCGCCG GCACACCGGC GACGGGCCGA TGGAGCACGC CGACGGGCAC 
GGGGACACCG GCTTCAGCCC GTGGGTGGGG GCGGACGACA TCGAGTTCCT GCGCCAGCCC 
GGGCCGTACA CCGCGATGGG CTGGAACATC GACCCGTCCG GCATGCTCGA GCTGCTCACC 
GACATCAGCA CCCGCTACCC GAGCGTGCCG CTGATGGTCA CCGAGAACGG CGCGGCCTTC 
TACGACACGG TGAGCGAGGA CGGCCACGTG CACGACGCCG ACCGGGTCGC CTACCTACAC 
GGGCACATCG ACGCGGTCGG CCAGGCCATC GACGCCGGGG CCGACGTGCG CGGCTACTTC 
CTGTGGTCGC TGCTGGACAA CTTCGAATGG GCCTGGGGCT ACGACCGCCG CTTCGGGATC 
ATCCGCGTCG ACTACGACAC CCAGGAGCGC ACCGTCAAGG ACTCGGCCAC GTGGTACTCC 
CGGCTGATCG CCACCCGCGA GCTGCCGCCG GTCGACTGA

Protein sequence

MTSTPRTFPE DFLWGSATAS YQIEGAVTED GRGPSIWDTF SHTPGKTMNG DTGDVADDHY 
HRWSADLDLI KGLGLQAYRF SLAWPRIQPT GSGAVNAKGV DFYSRLVDGL LERGVKPVVT 
LYHWDLPQAL EDEGGWTNRD TALRFADYAA HVAGALGDRV EMWTTLNEPW CSAFLGYASG 
VHAPGRTDGE AALRAAHHLN LGHGLAGRAV REVLGADTKL SVTLNLHVTR PVDPDSAADR 
DAIRQLDAVG NRVFLGPMLD GAYPADLLAD TASVTDWSFV RDGDEAACAV PIDVLGINYY 
STSRARRHTG DGPMEHADGH GDTGFSPWVG ADDIEFLRQP GPYTAMGWNI DPSGMLELLT 
DISTRYPSVP LMVTENGAAF YDTVSEDGHV HDADRVAYLH GHIDAVGQAI DAGADVRGYF 
LWSLLDNFEW AWGYDRRFGI IRVDYDTQER TVKDSATWYS RLIATRELPP VD