Gene Namu_3365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3365
Symbol
ID	8448980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3703243
End bp	3704385
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	74%
IMG OID	645042442
Product	glycosyl transferase group 1
Protein accession	YP_003202682
Protein GI	258653526
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00178378
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0354182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGGCCCA ACGCTTCCGC GCGAACCAAC GCGCCGACGT CAAGTTTCAA GATCCTGGTC 
ATCGCCTCGC TCCGGTATCC GATCGCGCAG CCGTTCGCCG GCGGGCTCGA GGCGCACACC 
TGGTCGCTGG CCACGGGGTT GCGGGCCCGC GGGCACTCCG TGCTGGTGGC CGGGGCCACC 
GGCAGCGACC CGAGTGTGGT CGGCTACGAA TTCGGCCGCC TGCCCACCGG CGACGGGTCC 
GAACGCGCCG ACATCACCAA TCATCCGGAC GTCAGCCGGG CCGAACGGCA GGGCTTCACC 
GACCTGATCG CGCAGGTCCG GGACGGCCTG CTGGGCTCGT TCGACCTGAT CCACAACAAC 
GCCCTGCACC CGTACCCGGT CGAGCAGGCG CACACCCTGG ACGTCCCGAT GGTCACCACC 
CTGCACACGC CGGTGCTGCC CTGGGCGCAG CGGGTGCTGG GGGAATCGGC CGTGCCCCAG 
CACAGCCAGC ACTTCGTGGC CGTCAGCCGG GCCACCGCCG ACGCCTGGCG CCCGCTGATC 
CGGCCCCAGG TCGTCCGCAA CGGGGTGGAC ACCGACCTGT GGCGTCCGGG TCCCGGCGGG 
CCCGGTGCGG TCTGGTCCGG GCGCATCGCC GCGGAGAAGG CCCCGCACCT GGCCATCGAC 
CTGGCCCGGG CGGCCGGGAT CGAGCTGACC ATCGCCGGCC CGATCGTCGA CGAGCCCTAC 
TACGCCGCCG CGGTCGCGCC CCGCTTGGGA CCGGGCGTCC GCTACGCCGG CCACCTGGAT 
CAACAGCGCC TGGCCGAGCT GGTCGGGCAC AGTGCGCTCG CGCTGGTCAC CCCGGTCTGG 
AACGAGCCGT TCGGGCTGGT CGCGGTCGAG GCGATGGCCT GCGGGACGCC GGTCGTCGCG 
CTGGCCCGCG GCGGCCTGCC GGAGATCGTG GACCGCCGGT CCGGACGGCT GATCCCGCCC 
ACCGAGGCCA CCGGGTTCGC CCCCGACGAC CTGGCCGCGG CGGTCCGGGC GATGGCGCAG 
GCGGCCACCC TGGATCGCGG CGCGGTCCGG CAGCGGGCGC TGGCCCGGGG CAGCGCGGCG 
GCGATGATCC GCGGCTACGA GCAGGTCTAT CAGCGGGCCG TTCGGCGCTG GACCCGGTCG 
TGA

Protein sequence

MRPNASARTN APTSSFKILV IASLRYPIAQ PFAGGLEAHT WSLATGLRAR GHSVLVAGAT 
GSDPSVVGYE FGRLPTGDGS ERADITNHPD VSRAERQGFT DLIAQVRDGL LGSFDLIHNN 
ALHPYPVEQA HTLDVPMVTT LHTPVLPWAQ RVLGESAVPQ HSQHFVAVSR ATADAWRPLI 
RPQVVRNGVD TDLWRPGPGG PGAVWSGRIA AEKAPHLAID LARAAGIELT IAGPIVDEPY 
YAAAVAPRLG PGVRYAGHLD QQRLAELVGH SALALVTPVW NEPFGLVAVE AMACGTPVVA 
LARGGLPEIV DRRSGRLIPP TEATGFAPDD LAAAVRAMAQ AATLDRGAVR QRALARGSAA 
AMIRGYEQVY QRAVRRWTRS