Gene Namu_3236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3236
Symbol
ID	8448850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3564860
End bp	3565984
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	74%
IMG OID	645042315
Product	glycosyl transferase group 1
Protein accession	YP_003202556
Protein GI	258653400
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0188616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000126621
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGGCGAA CACTGTTGGT CACCAACGAC TTTCCGCCTC GCGCCGGTGG AATTCAGTCC 
TACCTACTGG CATTGGCCCA GCGGCTGCCG GCCGACGCTC TGGTGGTCTA CGCGCCCGAC 
TGGCCGGGCG CGGCGGAATT CGATGCCGCT CAGCCGTTCT CGGTCTATCG GCACCCCGGT 
TCGTTGATGC TGCCGGGGGA CTCGGTCCGG CGCCGCGCCC TCGAACTGAT CCGGACCCAT 
CGGATCGGGG CCGTCTGGTA CGGCGCCGCG GCCCCGCTGG GGCTGCTCAC CCCAGGGCTG 
CGCGCGGACG GCATCGTGCG CACCGTCGCC TGTACCCACG GGCACGAGGT CGGGTGGTCG 
ATGCTGCCCG GTGCGCGCCA GGCTCTGCGC CGGATCGGCC GGGACAACGA CGTGCTCACC 
TTCGTCAGCC GCTATGCGCG GCGCCGCATC TCGGCCGCGT TGGGTCCGAT GGCGGCCCTG 
GAATACCTGC CGCCGGGTGT GCTCACCCAG ACCTACCGGC CCGATCCGGC GGCGCGACGC 
ACGGTGCGCC AGGACTATTG CCTCGGCGAT GCGCCGCTGG TGCTCTCGGT GTCCCGTCTG 
GTGGCCCGCA AGGGCCAGGA CGCCCTGATC CGGGCGGTGC CGCGGCTGCG TGACCGGGTG 
CCCGACGTGC GAGTCCTGAT CGTCGGCGAC GGCCCCGACC GCGGGCGGTT GGAGTCGCTC 
ATCGACCGGC TGCAGGTCCG GGACCAGGTG CGGCTGGCCG GGTCGGTTCC ATGGGCCGAT 
CTGCCGGCCC ACTACGCGTC CGCCGACGTG TTCGCCATGC CCTGCCGGAC GCGGGGCCTC 
GGGCTGGATG TGGAAGGCCT GGGCCTGGTG TTCCTGGAGG CCTCGGCCAG CGGGCTGCCC 
GTGGTGGCCG GCCGTTCCGG GGGCGCGCCC GAGACGGTGC TGCCGGGACG GACCGGAACG 
GTCGTCGACG GCCGCAACGT CGCCGAACTG GCCGACGCGG TGGGGGAGTT GCTGGCCGAT 
CCGGCCCGGG CCGCGGCCTG GGGTGCGCAC GGGCGGGACT GGGTCACCCG GGAGTGGACC 
TGGCAGGCGT CGGCGGATCG GTTGGCCGAG CTGCTGTCGG GCTGA

Protein sequence

MRRTLLVTND FPPRAGGIQS YLLALAQRLP ADALVVYAPD WPGAAEFDAA QPFSVYRHPG 
SLMLPGDSVR RRALELIRTH RIGAVWYGAA APLGLLTPGL RADGIVRTVA CTHGHEVGWS 
MLPGARQALR RIGRDNDVLT FVSRYARRRI SAALGPMAAL EYLPPGVLTQ TYRPDPAARR 
TVRQDYCLGD APLVLSVSRL VARKGQDALI RAVPRLRDRV PDVRVLIVGD GPDRGRLESL 
IDRLQVRDQV RLAGSVPWAD LPAHYASADV FAMPCRTRGL GLDVEGLGLV FLEASASGLP 
VVAGRSGGAP ETVLPGRTGT VVDGRNVAEL ADAVGELLAD PARAAAWGAH GRDWVTREWT 
WQASADRLAE LLSG