Gene Namu_4456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4456
Symbol
ID	8450083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4944459
End bp	4945835
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	65%
IMG OID	645043503
Product	polysaccharide biosynthesis protein
Protein accession	YP_003203731
Protein GI	258654575
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG ATCCGGTCGC GCCGGCCGCC CCGCCCAGCT TGTGGCGCAG CGTCGGTTCG 
ACGGCGATCA TGAAGGTCCT CGTGATGGGG ACGTCCGGGG TTCTCGGCAT CCTGACCAGC 
CGCATGATCC TGTCGCACTT CGGTATCGAC GCCTACGCCC AGTACGGCCT GCTGGCCAGC 
CTGCCCGCCC TGCTGCCCTT CGCCGACCTG GGCATCGCTG CCGTGGTCTT CAACGTGATT 
GCCGGCTCGG CCGACCCGCG AACCGACGAC ACCGTCCACC GGACGATCGT GACGGCCTTC 
CGTATTCTCT TGATCTCCGG GCCGGTGATC ATCGCCGTCG CCGTCGTCAT CTCGCTGTTG 
CAGCTGTGGC CGGCGCTGCT CGGCCAGGGT CTGATGCCTG ACGGGGGCAG CACTGTACTG 
ATCTGTGCGG TGATTTTCGG CTGCGGGCTG CCGTTGACAG TCGGTCAACG GATCCTGGTC 
GGACTCGGCC GGAACGGCAC ACAGGTCGCC GCCCAGGCGG TGGTGGCACC CTTCATCTTC 
CTGTGCGTCC TGGTCGCTGT CTGGCTGGGC TTGCCCGTTG GCAACGACCT CGCGGTACTG 
TCCTACGTCG GCGCGGCCCT GGTGTCGATC ATTTGCTTGG TCATCTCCGG TCGCTTGATC 
TCGCCGATGC TGACCCGATC CATCCGGGAT ATCCCGCGGA TCCGGGCCGT CCCCAAACTC 
CCGGTGATCG CCGTGGTCGG CCCGATGCTC GTGCAGATGA TCATCCTTCC GGTGGCCACC 
CAGATGGATC GGATTCTGCT GAGCAACTTC GCCGGTTCCG ATGATCTGGC GCAGTACAAC 
CTCGGGTCGC AACTGTTCGG CATCGCTCTG CAGACGATCT CGGCGGCCGG GTTGGCCTTG 
TGGCCCATCT ACGCCAAAGC CAGGTCGTCC GACCACATCC GATCGCCGCT GCGTCCGTCC 
GCCATGTTCA TGGTCGGTGG CCTGGTGATC GCCGTGATCA TGGCGCTGTT GTCACCATTG 
CTGGTGCGTT TCGTCTCGAG TGGTCAGTTG CACCTAGGGC TGAGCCTGGT GTTGGCGTTC 
GTCGTCCTGG TCAGCGTGCA AGCGGCCAAA TACCCGCTGG GCATGTACAT GACGGATGAA 
CGGGGTCTGC GATTTCAGGT GATACCGATC ATGATCCTCC TGCCGTTGAA CATCGGATTG 
TCGATCGTCC TGATCAGATG GATTGGCGCA GCCGGCCCAG TCTGGGCCGG GGCAACGTCG 
GCGCTGCTCT GCCAGGTGCT GCCGAACCTC TGGTATGTCA CGAAGGACCT GAACCGTCGA 
AGGGCCGCCG CCCGGGCTGG GACGGCGGGC ACGGCGCCGT CCGAATTACT CGAGTGA

Protein sequence

MTADPVAPAA PPSLWRSVGS TAIMKVLVMG TSGVLGILTS RMILSHFGID AYAQYGLLAS 
LPALLPFADL GIAAVVFNVI AGSADPRTDD TVHRTIVTAF RILLISGPVI IAVAVVISLL 
QLWPALLGQG LMPDGGSTVL ICAVIFGCGL PLTVGQRILV GLGRNGTQVA AQAVVAPFIF 
LCVLVAVWLG LPVGNDLAVL SYVGAALVSI ICLVISGRLI SPMLTRSIRD IPRIRAVPKL 
PVIAVVGPML VQMIILPVAT QMDRILLSNF AGSDDLAQYN LGSQLFGIAL QTISAAGLAL 
WPIYAKARSS DHIRSPLRPS AMFMVGGLVI AVIMALLSPL LVRFVSSGQL HLGLSLVLAF 
VVLVSVQAAK YPLGMYMTDE RGLRFQVIPI MILLPLNIGL SIVLIRWIGA AGPVWAGATS 
ALLCQVLPNL WYVTKDLNRR RAAARAGTAG TAPSELLE