Gene Namu_5241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5241
Symbol
ID	8450872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5844399
End bp	5846438
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	69%
IMG OID	645044272
Product	glycoside hydrolase 15-related
Protein accession	YP_003204496
Protein GI	258655340
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	72
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA CCGATGACGC CGCCGGCAGC GCCCCGGCCG CCGACGGCCT CGACGCCAGC 
TTCGACGCCG TGATGGCCTC GCCGACCGGC GGGGTGCACG TGCTGGATCC GCCGAACACG 
GCGGCCGCCT CGGACGCCCC GCTGCATCCG GTGCACCACA GCTCGGGCAA CTTCCCCAGC 
ATCGGCGACT ATGCGTTCCT GTCCGACTGC GAGTCGAACT GCCTGATCGC ACCGTCGGGG 
GCGGTCGAGT GGATGTGTGT GCCCCGTCCC GACTCCCCCA GCGTGTTCAC CGCCCTGCTG 
GATCGGGCTG GCGGCTCGTT CCGGGTGGCG CCGTTCGGCG TCGCGGTCCC GGCGGCCCGC 
CGCTATCTGC CCGGCACCCT GGTGCTGGAG ACCACCTGGC AGACCCCGAC CGGCTGGTTG 
ATCGTCCGGG ACGCGCTGAT CATGGCCGAG TGGCACAACA CCGATCAGCG GTCCAAGACG 
CACCGCCGGT CCCCCACCGA CTACGACGCC GCGCACGTGC TGCTGCGCAC CATCAAGTGC 
GTCTACGGCA CGGTCGATCT GCAGATGAGC TGCGAGCCGG TCTTCGACTA TGCCCGCAAG 
GGGGCCAAGT GGACCTACCC GAAGCCGGAC TACTCCGAGG TCGTGGCCAC CGCGAAGGGC 
CAGCCGACGT TGCGGCTGGC CAGTTCGCTG CGGATCGGGT TGGAGGGCCG CACCGCGCAG 
GCCCGGACCA AGATGAAGCG CGACGAGGTG CACTACGTCG CCCTGGCCTT CTCCGACCTG 
CCGCCGCCGG TGGACACCGC CCAGGCCGAG GACTGGATGT GGCGCACCGG GGAGTACTGG 
CGGCAGTGGT TGTCCCAGGG CACCTTCCCG GACCACCCGT GGCGGGCCTA CCTGCAGTCG 
TCGGCGCTGG CCCTCAAGGG GCTCTCGTAC GCGCCGACCG GGGCGCTGCT CGCGGCGGCG 
ACCACCTCGC TGCCGGAAAC GCCGGGCGGG GAACGGAACT GGGACTACCG GTTCACCTGG 
ATCCGGGACT CGACGTTCGC CCTGTGGGGT CTGTACACGC TCGGGTTCGA CCGGGAGGCC 
AACGACTTCT TCTACTTCAT CCATGACGTG TGCCGGGACA ACCCGAACGA CCTGCAGATC 
ATGTACGGCG TCGGCGGCGA GCGTCATCTG GAGGAGGGGA CGCTGGATCA CCTCACCGGG 
TACGACGACG CCCGCCCGGT GCGGATCGGC AACGGCGCCT ACAACCAGCA GCAGCACGAC 
GTGTGGGGCG CGCTGCTCGA CTCGATCTAC CTGCACACCC GATCCCGCGA GCAGATGCCC 
GAAGAGCTCT GGCCGATCGT CATCGCCCAG GTCGAGCAGG CGGCGGCGCA CTGGCGCGCT 
CCGGACCGCG GCATCTGGGA GGTGCGCGGC GAGCCGCAGC ACTTCACCGC GTCCAAGATC 
ATGTGCTGGG TGGCGCTGGA CCGCGGCGTA CGGCTGGCCC GGTTGCACGA CTCGCACGAG 
ATCGCCGACA AGTGGGAGAA GATCGCCGAC GAGATCCACG CCGACGTGCT GGCCAACGGC 
GTCGATGAGC GTGGGGTCCT GGTCCAGCGG TACGGCGCGG ACGCCCTGGA CGCCTCGCTG 
CTGCTGGCCC CGCTGGTGCG GTTCCTGCCG CCGGACGACC CGCGGATCAA GGCCACCGTG 
CTGGCCATTG CCGACGAGTT GACCCACGAC GGGCTGGTGC TGCGCTACCG GGTGGAGGAA 
ACCGACGACG GCCTGTCCGG TGAGGAGGGC ACCTTCACCA TCTGCTCATT CTGGCTGGTC 
TCCGCATTGG TGGAAATCGG CGAGGAAGAA CGGGCGCACG CCCTGTGCGA GCGATTGCTC 
GCCCATGCCT CGATCCTGGG GTTGTATGCG GAAGAACTCG ATTCGGTGAG CGGCCGTCAT 
CTGGGTAATT TTCCGCAGGC ATTCACCCAT CTGGCCCTGA TCAATGCCGT CACGCACGTG 
ATTAGGGCCG AGGAGCGGCG CCGTTCGCAC GGATTTGCGC CGGCTAACCG GCAGGCTTGA

Protein sequence

MTDTDDAAGS APAADGLDAS FDAVMASPTG GVHVLDPPNT AAASDAPLHP VHHSSGNFPS 
IGDYAFLSDC ESNCLIAPSG AVEWMCVPRP DSPSVFTALL DRAGGSFRVA PFGVAVPAAR 
RYLPGTLVLE TTWQTPTGWL IVRDALIMAE WHNTDQRSKT HRRSPTDYDA AHVLLRTIKC 
VYGTVDLQMS CEPVFDYARK GAKWTYPKPD YSEVVATAKG QPTLRLASSL RIGLEGRTAQ 
ARTKMKRDEV HYVALAFSDL PPPVDTAQAE DWMWRTGEYW RQWLSQGTFP DHPWRAYLQS 
SALALKGLSY APTGALLAAA TTSLPETPGG ERNWDYRFTW IRDSTFALWG LYTLGFDREA 
NDFFYFIHDV CRDNPNDLQI MYGVGGERHL EEGTLDHLTG YDDARPVRIG NGAYNQQQHD 
VWGALLDSIY LHTRSREQMP EELWPIVIAQ VEQAAAHWRA PDRGIWEVRG EPQHFTASKI 
MCWVALDRGV RLARLHDSHE IADKWEKIAD EIHADVLANG VDERGVLVQR YGADALDASL 
LLAPLVRFLP PDDPRIKATV LAIADELTHD GLVLRYRVEE TDDGLSGEEG TFTICSFWLV 
SALVEIGEEE RAHALCERLL AHASILGLYA EELDSVSGRH LGNFPQAFTH LALINAVTHV 
IRAEERRRSH GFAPANRQA