Gene Namu_0889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0889
Symbol
ID	8446481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	979516
End bp	980958
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	67%
IMG OID	645040026
Product	glycoside hydrolase family 1
Protein accession	YP_003200289
Protein GI	258651133
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA TTTCCGCACC AACGCAGTTC CCGCCCGGCT TCCTGTGGGG CGGCGCCACC 
GCCGCCAACC AGGTGGAGGG CGGCTACGAC CAGGGCGGCA AGGGCCTGTC CATCCAGGAC 
GTGATGCCCC AGGGCATCGT CGGTCCGCGC ACCGACGGCC CCACCCCGGA GAACCTCAAG 
CTGACCGGCA TCGACTTCTA CCACCGCTAT GCCGAGGACA TCGCCCTGTT CGCCGAGATG 
GGCTTCTCGG TCTACCGGTT CTCCATCGCC TGGAGCCGGA TCTTCCCGGG CGGTGACGAC 
GCCGAGCCCA ACGAGGAGGG CCTGGCCTTC TACGACCGGG TGCTCGACGA GCTGGAGCGG 
CACGGCATCG AGCCGCTGAT CACGCTGTCG CACTACGAGA CCCCGCTGGC CATCGCCGAG 
AAGTACGACG GCTGGGTCTC CCGGGACGTC ATCGCCCTGT TCGAGCGGTA CGTGCGGGTC 
GTGTTCGCCC GCTACGGCCA CCGGGTGAAG TACTGGCTGA CCTTCAACGA GATCAACTCG 
GTGATCCACG CGCCGTTCAT GAGCGGCGGC ATCAACACCC CCAAGGACGA GCTGACCCCG 
ACCGACCTGT ACCAGGCGAT CCACCATGAG CTGGTGGCCA GCGCGCTGGC CACCAAGATC 
GCGCACGAGA CCGACCCGCA GATCAAGGTC GGCTGCATGG TGCTGGGCAT GCCGATCTAC 
CCGCTGTCCC CCGACCCGAA CGATCTGCTG GCGTCGATGA CCGCCGATCA CGCCAACCTG 
ATGTTCAGCG ACGTGCACAC CCGCGGCGAG TACCCCGGAT ACGCCCTGCG GTACTTCCGG 
GAGAACGGCA TCGAGCTGCA GATCACCGAA CAGGACCGGG AACTGCTGGC CGCGCACACC 
GTCGACTTCG TCTCGTTCAG CTACTACATG AGCATCTGCG AGACCGGGGA TCCGGCCAGG 
CGCCTGGCCG GTGCGGGCAA CATCATGGGC GGGGTGCCGA ACCCGCACCT GCCGGCCTCC 
GAATGGGGCT GGCAGATCGA CCCGGTCGGG CTTCGGGTCA TCCTCAACCA GTTCTGGGAC 
CGCTGGGGCA AGCCGCTGTT CATCGTCGAG AACGGGCTCG GCGCCCGGGA CGAGCTGGTC 
GAGTCGGCTG ACGCCGTCGA CGGTTTCACC GTCCTGGACG ACTACCGGAT CGACTACCTG 
CGCGCGCATC TGCAGCAGGT CGGCGAGGCC ATCGCCGACG GCGTCCAGGT GCTGGGCTAC 
ACCAGTTGGG GCCCGATCGA TCTGGTCAGC GCCTCGACCG CGCAGATGTC CAAGCGGTAC 
GGGTTCATCT ACGTCGACCG CAACGACGAC GGCACCGGCA CGCTGGCCCG CTACCGCAAG 
AAGTCGTTCC ACTGGTACGC GCAGGTCATC GCGACCAACG GCGCCACCCT CCGGCAGAAC 
TGA

Protein sequence

MTSISAPTQF PPGFLWGGAT AANQVEGGYD QGGKGLSIQD VMPQGIVGPR TDGPTPENLK 
LTGIDFYHRY AEDIALFAEM GFSVYRFSIA WSRIFPGGDD AEPNEEGLAF YDRVLDELER 
HGIEPLITLS HYETPLAIAE KYDGWVSRDV IALFERYVRV VFARYGHRVK YWLTFNEINS 
VIHAPFMSGG INTPKDELTP TDLYQAIHHE LVASALATKI AHETDPQIKV GCMVLGMPIY 
PLSPDPNDLL ASMTADHANL MFSDVHTRGE YPGYALRYFR ENGIELQITE QDRELLAAHT 
VDFVSFSYYM SICETGDPAR RLAGAGNIMG GVPNPHLPAS EWGWQIDPVG LRVILNQFWD 
RWGKPLFIVE NGLGARDELV ESADAVDGFT VLDDYRIDYL RAHLQQVGEA IADGVQVLGY 
TSWGPIDLVS ASTAQMSKRY GFIYVDRNDD GTGTLARYRK KSFHWYAQVI ATNGATLRQN