Gene Namu_5248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5248
Symbol
ID	8450879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5856910
End bp	5858763
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	64%
IMG OID	645044279
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_003204503
Protein GI	258655347
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCACCGGA ACGTGAGCGG TCTGATTGCC CGCATGTCAA GCCATCGACA CTTTTGGTTG 
CTCCTGTTCG ACTCGACGGT CTGGGTATTG GCCGTCGGGT TCGCTGCCGT TGCCCGGATG 
GACTTCCAGT TCGTTCAGGT CGGTTGGCCA TCGACGATGG TGCTCGCCGC CATCTGTGTC 
GTGACATTTG CGATCGTGGG GTGGATCTCG CGTCTGCATG AAGGCCGCGC CCCGCTTGGC 
AGCCTGGACG AGACGATCCG GCTGGCCTCT GCCGTGCTGT GCGTCGGGGT CGCCGTTTAC 
TTGGCCAACC TGCTCTTTCT GCACCTCGTC CCGCGATCGG TGCCACTGAT TGCAACGCTG 
GTGGCGGTCA TTGTGATGGC GTGGGGGCGG GCCCTCGTGC GGGCCATCCG CGACAGTTGG 
AGCATCACCG ATACGGCCGG GCGCGGGCAG CCGGTGCTGG TGATCGGTGC CGGTGACGGC 
GGACGGCAGC TAATCAGGTC GATGCGTCGG GATCCAGCGT CGCGGTGGTC ACCGGTTGGG 
ATCCTCGACG ACGATCGACA CAAGCGGCAC CTGCGCATCG ACGGTGTTCC GGTCCTGGGC 
ACGATTGCCG AGTTGGCGAC CGTGGCCCAC GAAAGTGATG TGTCGACGGT CGTTGTGGCC 
ATCCCCAGCG CGCCGGCCTC ACTGCTGCAG GACATCTCCA ATCAAGCAGC GGACGCCCAG 
CTGACGGTCA AGATCTTGCC CGGCGTGGAG GAGTTGCTCG GTGGACGGGC CGGGATCAAA 
GATGTCCGCG ATATCAACAT CCCCGACCTG CTCGGTCGCC GCCAGATCGA CACGGACGTC 
GCCGCCATCG CCGGCTACCT GACCGGCCAA CGGGTGTTGG TGACTGGGGC CGGCGGCTCG 
ATCGGATCGG AACTGTGCCG TCAGATCAGC CGGTGGAGCC CGGCCCACCT CATCATGCTG 
GACCGGGATG AATCCGCGCT GCACGCGGTG CAGTTGTCGA TCGAAGGCCG AGCCCTGCTC 
GATTCCAGCG ACATCATTCT GGCCGACATC CGGGATCGCG ACCGGATCAT GGGCATCTTC 
CGGGAGCATC GTCCCCAGGT CGTCTTTCAC GCCGCGGCCC TCAAGCACCT GCCCATGTTG 
GAGCAGTACC CGGCCGAGGC CGTCAAGACC AACATCTGGG GTACCCAGAC CGTGCTCGAG 
GCGGCCGCCG CCGTCGACGT CGAACGATTC GTCAATATCT CCACCGACAA GGCAGCGAAT 
CCGGTCAGCG TGCTGGGCTA CTCCAAACGG ATCGCCGAGG GCCTCACGGC GGCCATGGCC 
GTGCGGGCCA CTGGCACCTA CCTCAGCGTT CGCTTCGGCA ACGTCTTGGG TAGCCGCGGT 
TCGGTGCTCA CCGCGTTCGC CGCGCAGATT GCCGCCGGCG GTCCCGTCAC GGTCACCCAC 
CCCGACGTCA CTCGGTTCTT CATGACCGTC AACGAGGCCG TTCAGTTGGT GATTCAGGCC 
GCTGTGCTCG GGCACGACGG CGAGGCCCTC GTCCTCGACA TGGGAGAGGC GGTGCGCATC 
GACGCCATGG CCCGGCAGCT CATCGCGCTG TCCAAGCAGG ACATCGCGGT CGAGTACACC 
GGGCTCAGGG ACGGCGAAAA GATGCATGAA GATTTGCTGG GCCATGACGA GCCGGACCTG 
CGCCCCATGC ATCCCCTTGT CTCCCATGTC GATGTCCCCC CGCTAGTTTC CGACCACCTT 
GTTCCTATCG ACATAGCCCA ACCCGCCACG ATTACCAACG CTCTTGGCGC TCTATGCACC 
GCAATGACAA GAAACAAGGA GATTATCTGC GATGACGAAC TCCTCCCACG CTGA

Protein sequence

MHRNVSGLIA RMSSHRHFWL LLFDSTVWVL AVGFAAVARM DFQFVQVGWP STMVLAAICV 
VTFAIVGWIS RLHEGRAPLG SLDETIRLAS AVLCVGVAVY LANLLFLHLV PRSVPLIATL 
VAVIVMAWGR ALVRAIRDSW SITDTAGRGQ PVLVIGAGDG GRQLIRSMRR DPASRWSPVG 
ILDDDRHKRH LRIDGVPVLG TIAELATVAH ESDVSTVVVA IPSAPASLLQ DISNQAADAQ 
LTVKILPGVE ELLGGRAGIK DVRDINIPDL LGRRQIDTDV AAIAGYLTGQ RVLVTGAGGS 
IGSELCRQIS RWSPAHLIML DRDESALHAV QLSIEGRALL DSSDIILADI RDRDRIMGIF 
REHRPQVVFH AAALKHLPML EQYPAEAVKT NIWGTQTVLE AAAAVDVERF VNISTDKAAN 
PVSVLGYSKR IAEGLTAAMA VRATGTYLSV RFGNVLGSRG SVLTAFAAQI AAGGPVTVTH 
PDVTRFFMTV NEAVQLVIQA AVLGHDGEAL VLDMGEAVRI DAMARQLIAL SKQDIAVEYT 
GLRDGEKMHE DLLGHDEPDL RPMHPLVSHV DVPPLVSDHL VPIDIAQPAT ITNALGALCT 
AMTRNKEIIC DDELLPR