Gene Namu_4209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4209
Symbol
ID	8449835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4653281
End bp	4654321
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	67%
IMG OID	645043258
Product	glycosyl transferase family 2
Protein accession	YP_003203487
Protein GI	258654331
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.220629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCCGG ATCTCCGGAT CGCCGCGATC GTTCCGTGCC ACAACGAAGA GGCTGCGGTG 
GGCCAGGTGG TCACCGACCT GCGCGCTGCC GTGCCCGGTA TGGCGATCTA CGTCTACGAC 
AACCGATCGA CCGACCGGAC GGTCGAGGTC GCTCAAGCGG CCGGCGCCAT CGTGCGGCGT 
GAAGAGGTCA AGGGCAAGGG CAACGTGGTC CGTCGAGCAT TCGCCGACAT CGAGGCCGAC 
GTGTACCTGC TCATCGACGG CGACGACACC TACGACGCCT TCGCCGCCCC GCGGATGATC 
GACACCCTGC TCGCGGGGCC GTACGACCAC GTGCTCGGTG TGCGCAAGCA GACCACCGAC 
TCCGCCTACC GGCCGGGCCA CTCGGCCGGC AACAAGCTAT TCAACAGGCT GGTCACGACC 
GCCTTCGGCA CCCCGGTCAG CGACATGCTC AGCGGCTATA GGATCTTCTC CCGACGATTT 
GTGAAATCGT TCCCGGCGGT GTCCCGCGAA TTCGAGATCG AGACCGAGCT CACCGTGCAC 
ACGATGAGCC TGCGCGTGCC GCAGACCGAA GTGCCGGTGG ACTTCAAGGA CCGCCCCGAA 
GGCAGCGAGA GCAAGCTCAA CACGTACCGG GACGGATTCA AGATCCTGTC CTTGATCTTC 
CAACTCATCC GGCACGAACG TCCGCTGGCG TTCCACACGA TCACCGCCGG TCTCATCGCG 
ATCATCGCGC TCATCCTCGG CGTCCCGCTG GTCGTCGAGT TCGGCCGGAC CGGGCTGGTC 
CCGCGGTTCC CGACCGCGTT CCTGGCCGCA TCCCTGATGG TGATCGCGGC GCTGGTCCTG 
ACCATCGGCG TCGTGTTGGA CGGCATTACC CGCAGCCGGC GCGAATCGGC CCGGTTGGTG 
TATCTGGGCT ACGAGGCACC CGGCCGGCCC CGGCACTCTT CGCCCGCCCG GCACGACCGG 
CCGGTCACCG GGCCCGAAAC GCGTCAGCCG ACCGCGCCAT TGCATCAGCA AGGGCGACCC 
GCCACGGTCG TAGGGGGTTA A

Protein sequence

MYPDLRIAAI VPCHNEEAAV GQVVTDLRAA VPGMAIYVYD NRSTDRTVEV AQAAGAIVRR 
EEVKGKGNVV RRAFADIEAD VYLLIDGDDT YDAFAAPRMI DTLLAGPYDH VLGVRKQTTD 
SAYRPGHSAG NKLFNRLVTT AFGTPVSDML SGYRIFSRRF VKSFPAVSRE FEIETELTVH 
TMSLRVPQTE VPVDFKDRPE GSESKLNTYR DGFKILSLIF QLIRHERPLA FHTITAGLIA 
IIALILGVPL VVEFGRTGLV PRFPTAFLAA SLMVIAALVL TIGVVLDGIT RSRRESARLV 
YLGYEAPGRP RHSSPARHDR PVTGPETRQP TAPLHQQGRP ATVVGG