Gene Namu_3527 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3527
Symbol
ID	8449146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3875358
End bp	3876659
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	73%
IMG OID	645042605
Product	glycosyl transferase group 1
Protein accession	YP_003202841
Protein GI	258653685
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000428003
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.043147
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGG CCACCGGCGC CCCCATCCAC CGGGTCGTGC TGATCACCGC CACCGAGCCC 
GAGCCCCGTT CGTTCGGCAA GCAGGTGGTG CTCGGCGGCA TCCTGGACCA CCTGTGCCAC 
CGGCTCGGTC CCGACCAGGT GCACGTCATC ATCGTCGGCC GGACCAGCAT CGACCGCCCG 
CCGGTGCGCT ACCAGCGGCA CGTCATCGCC AAGCCGACCG CCGTGGAGCA GGCCGGCGCG 
GTCCTGCAAC GGGTGGTCCG GCCGCCGCAC ACCTCCCTGC AGGAGGCCGC CCTGTGGTCG 
GCCCGGGTGC TGGCGGCGAT CGCCGAGCAA CTGGCCGAGA TCCGCGCCGA CCTGCAGATC 
TGGGACACCA TGCGGACCGG GCAGTACGCC CGGTACATGG GGCGCAAACC ACGGGCGCTG 
TACGCCGACG ACCTGTTCTC CAAGCGCTAC GCCAGCATGC TCGACCGGAT CGATCAGGAC 
CAGTCCGAGG TCACCGATCC GCTCGGCGAG TTCGGCAAGT TGCTGCCGCG GGCCGTCGGC 
CGGGTGGTCG AGCGCAAGTT CGTCTACCGC CGGCTGCTGC AACTCGAGCA GGCCTCCACG 
GCGCGCTCCG AGGACCAGGC GCCCGAGCTG TTCGACGCCA CCCTGCTGGT CAACGCCCAG 
GAGTCCGACG AGCTCTACGA GCGGACCGGC AACCCGACGA TCAGCACCCT GCTGCCGATG 
CTGCGCGAGC CGGCGCGACA CGTGCGCGGC TGGGACGGGC AGCCGGTCTT CGTCTTCCTC 
GGCGGCCTGG ACTTCGCGCC CAACCGCGAC GGCCTGACCT GGTTCCTGGC CACCTTCCGG 
GAGCAGGTGC TGGCGGCCAT CCCGGACTTC CGGCTGCTGG TGGTGGGCCG GGGGTCGTCG 
CGGCCGCTGC CCGAGGCGGC CGCCTGGGGC GAGCACGTCC AGGTGCTGGG CTGGGTCGAC 
GATCTGGACG AGGTGCTGGG CTCGTGCGCG GCGCTGTTGT CCCCGCTGCG GATGGGCAGC 
GGCACCAAGA TCAAGGTGCT CGAGGCGCTG GCCCGCGGGC TGCCGGTGGT GGCCACCCGG 
GCCGGCGTGA TGGGGTTGGC GGTCGACGAG TCCGACGGCT GCCTGGTCGC GCCGACCGAC 
TCCGAGCTGG TCGGGCTGCT GGCCCGCGCG GTCCAGCCGG ACACGAACGC CGCCCTGTCG 
GCGGCCGCCC GGGACAGCTG GGGGCGCAAC TACTCGCCGG CCGTGGTCGG CCCGGCCTAC 
GACGACGCGT TCGGCCTGGC CCCGGTCCGG GACGCGGGCT GA

Protein sequence

MTMATGAPIH RVVLITATEP EPRSFGKQVV LGGILDHLCH RLGPDQVHVI IVGRTSIDRP 
PVRYQRHVIA KPTAVEQAGA VLQRVVRPPH TSLQEAALWS ARVLAAIAEQ LAEIRADLQI 
WDTMRTGQYA RYMGRKPRAL YADDLFSKRY ASMLDRIDQD QSEVTDPLGE FGKLLPRAVG 
RVVERKFVYR RLLQLEQAST ARSEDQAPEL FDATLLVNAQ ESDELYERTG NPTISTLLPM 
LREPARHVRG WDGQPVFVFL GGLDFAPNRD GLTWFLATFR EQVLAAIPDF RLLVVGRGSS 
RPLPEAAAWG EHVQVLGWVD DLDEVLGSCA ALLSPLRMGS GTKIKVLEAL ARGLPVVATR 
AGVMGLAVDE SDGCLVAPTD SELVGLLARA VQPDTNAALS AAARDSWGRN YSPAVVGPAY 
DDAFGLAPVR DAG