Gene Namu_4823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4823
Symbol
ID	8450453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5375300
End bp	5376610
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	76%
IMG OID	645043862
Product	UDP-glucuronosyl/UDP-glucosyltransferase
Protein accession	YP_003204087
Protein GI	258654931
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTGC TGGTGATCAG CCCCGACTAC GCCTCGCACC TGCTGCCGCT GGCCACCTTG 
GCGACCGCCT GGCGCGATGC CGGCGAGCGG GTGGTGGTGG CCAGCGGGCC GGCCACGGCC 
GCCATCACCG CCGACTTCGG CTTCGCCCGC ACCGACCTGC GGCTGGGCCG CGGCTCCAAC 
CCCGGGGTGA TCCGCGCCCA GGAGCAGGTC GCCGGGGAGG ACGACGCGCT GCGCGGATTC 
TTCGCCGCGA CCGAGCGGGG CATGGTGCCC ACGCTGCAGT ACCAGGCCGA CGCGCGCCGG 
GCCGACCTGC TGTGGGATCC GGTCGCCACC GCCCGCCGGG TGCTGGCCGT GGTCGACCAG 
GTCCGGCCCG ACCACGTCCT CGTCGACCAC CTGGCCTTCA GCGCGCGGTT GGCCCTGCTG 
GCCGGCGGCG TCCCGCACGC CGACGTGGTC CTCGGGCACC CCACCGCGCT GCCGGTCGGC 
GACGAGGTCT ACGGCTATCC ACCGGCCTGG CCGGCCGTGT TCACCCCCGA TCCCGACGAC 
CTGGCCACCC TGCACCAGCG GTGTCGGGAG GTCCGGGACG GGTTCACCGC GGAGTGGAAC 
GCGGCCCTGG CCGAGCTGGC CCCGCAGGCC CCGGCGTCGG TCGACGCCTT CACCGAACAC 
GCCGGCCAGG TGCTGCTGAA CTACCCGGCA GCGCTGCACG ACCCGGCGCG CACGGCGCTG 
CTGCCGTCGC ACGCCTTCCT GGGCTCCGCG GTGCGCGCCC AGCCGACGCC GCCGGACATC 
GCGGACTGGT TGGCCGCCGA CCCGTCCCGG CCGCTGGTCT ACGTCAGCTT CGGCAGCTTC 
CTGTCGGTCC GGGCCGATGT GCTGGCCCGG GTCGCGCGGG CGTTGGCCGC GCTGCCGGTG 
CGGGTCGCGC TGGCCGTCGG GTCGGCCGAC CGGGCGGTGC TCGGTGAGCT GCCGCCGCAC 
TGGCTGGTCC GTGAGTTCCT GCCGCAGGTC GCGCTGCTCG AGCACGCCGC CGTGACGGTC 
ACCCACGGCG GCAACAACAG CGTCACCGAG GCCCTCATGG CCGGCGTGCC GATGCTGGTG 
CTGCCGTTCT CCACCGACCA GTTCGCCGGG GCCGCCGCCA TCGTCGACGC CGGCGTGGGC 
ATCGCCCTTG ACCCCAACGC CGCCTCGCCG GCCGAGCTGC GGGCGGCGCT GGCCGAGTTG 
CTCGACGGCG ACCAGGCCCG GGTCGCCGCG GACCTGGGCG CCGGCCTGCG GGAGCGACCG 
GGCCGGCAGA TCGCCTGGCA GGCGCTGGCG CCCGCCGCAA CCGGGAATTG A

Protein sequence

MTLLVISPDY ASHLLPLATL ATAWRDAGER VVVASGPATA AITADFGFAR TDLRLGRGSN 
PGVIRAQEQV AGEDDALRGF FAATERGMVP TLQYQADARR ADLLWDPVAT ARRVLAVVDQ 
VRPDHVLVDH LAFSARLALL AGGVPHADVV LGHPTALPVG DEVYGYPPAW PAVFTPDPDD 
LATLHQRCRE VRDGFTAEWN AALAELAPQA PASVDAFTEH AGQVLLNYPA ALHDPARTAL 
LPSHAFLGSA VRAQPTPPDI ADWLAADPSR PLVYVSFGSF LSVRADVLAR VARALAALPV 
RVALAVGSAD RAVLGELPPH WLVREFLPQV ALLEHAAVTV THGGNNSVTE ALMAGVPMLV 
LPFSTDQFAG AAAIVDAGVG IALDPNAASP AELRAALAEL LDGDQARVAA DLGAGLRERP 
GRQIAWQALA PAATGN