Gene Namu_3376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3376
Symbol
ID	8448991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3715283
End bp	3716482
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	73%
IMG OID	645042453
Product	glycosyl transferase group 1
Protein accession	YP_003202693
Protein GI	258653537
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000624508
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000924483
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCATGC GCTTCGGTTT CATCAGCACC TATCCGCCGA CCCAGTGCGG TCTGGCTACC 
TTCACCGCTT CGTTGTCCGG CGCCCTGACG GCCGGCGGCA CGGCCGAGTC CCGGATCGCC 
CGGCTGCTGG AGAGCGCGCC GGCCGCGCAC CGCGGTCGCG AGGCCGTCGG CGACGGTGTC 
GGCGGTGTCG GCGGTGTCGA CATTGTCGCC GGTGACCCGC GGACCGCAGC CCGCTCGATC 
GACCGTCTGA ACCGGTGCGA CGTGGTCATC GTCCAGCACG AGTTCGGCAT CTACGGCGGA 
CCGGACGGCG ACGAGGTCCT CGCCCTGCTG GCCGGCCTGA CCGTGCCCAC CATCGTCGTG 
CTGCACACCG TGCTGACCGA GCCGACCGCC CACCAGCGGA TCGTGCTGGA CGGTGTGCTG 
GCCGCCGCCG GCGCCGTCGT CACCATGTCC GAGACCGCGC ACCGCCGGCT GCTGACCGGC 
TACCGGGTCG ACCCGGCCAA GGTCGGCGTG ATCGCCCACG GCGCGCCCGA GTCGACCTTC 
CCGGTGCCCG TGCCGGCCGC GACCCCGACG ATCGGCACCG CAGGTACCGA CACCGAGACC 
GACACGCCGA CCGTGCTGAC CTGGGGCCTG CTCGGCCCCG GCAAGGGCAT CGAGTGGGGC 
ATCGAGGCAA TGGCCCACCT CAAGGACCTG CGCCCGTCGA TCCACTACGT GGTCGCCGGG 
CAGACCCACC CGAAGGTGCT GCTGCACCAG GGCGAGCAGT ACCGCGAGGG CCTGCAGCGG 
CGGATCGAAC GCCGGTCGCT GACCGGGTCG GTGCACCTGG AGGGCCGGTA CCTGGACACG 
CCCACCCTGG CGTCCCTGGT CGCCGCCGCC GACGTGGTGC TGCTGCCCTA CGACTCGACC 
GAACAGGTCA CCTCCGGGGT GCTCATCGAA GCGGTCGCCG CCGGCAAACC CGTGGTGGCG 
ACCCGCTTCC CGCACGCCGT CGAGCTGCTC TCGGGGGGCG CCGGCATCGT GGTCCCGCAC 
CGCGACCCGG TCTCCATCGC CGAGGGTCTG CGCCGGGTGA TCACCAGCCC GGAGCTGGCC 
GCGAGCATGT CCCGGGCGGC CGCGGCCGCG GCGCCCGACC TGCGGTGGTC CGCGGTGGCC 
AAGCAGTACC GCTTCCTGGC CGAACGGCTG ATCGCCCAGG CCGGCGTGGT GGCCGCGTGA

Protein sequence

MPMRFGFIST YPPTQCGLAT FTASLSGALT AGGTAESRIA RLLESAPAAH RGREAVGDGV 
GGVGGVDIVA GDPRTAARSI DRLNRCDVVI VQHEFGIYGG PDGDEVLALL AGLTVPTIVV 
LHTVLTEPTA HQRIVLDGVL AAAGAVVTMS ETAHRRLLTG YRVDPAKVGV IAHGAPESTF 
PVPVPAATPT IGTAGTDTET DTPTVLTWGL LGPGKGIEWG IEAMAHLKDL RPSIHYVVAG 
QTHPKVLLHQ GEQYREGLQR RIERRSLTGS VHLEGRYLDT PTLASLVAAA DVVLLPYDST 
EQVTSGVLIE AVAAGKPVVA TRFPHAVELL SGGAGIVVPH RDPVSIAEGL RRVITSPELA 
ASMSRAAAAA APDLRWSAVA KQYRFLAERL IAQAGVVAA