Gene Namu_4454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4454
Symbol
ID	8450081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4942002
End bp	4943162
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	67%
IMG OID	645043501
Product	glycosyl transferase group 1
Protein accession	YP_003203729
Protein GI	258654573
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.455752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCCCG TCGGGTCCGG CAGCGGCCGT CGCGCGCTGG TCGTGCATCC GGGCGCCGAC 
TTGTACGGAT CCGATCGGGT GTTGCTCGAG ACGGTGGGCG CGCTGGTGGA GGCGGGCTGG 
GCGGTGACGG TCAGTGTTCC GGCGGCCGGC CCATTGGTTG CCGTCCTGGT CCATCGGGGG 
GCCAGCGTCC AGGTGTGTCC GACGCCGGTC CTGCGCAAGA GCGTCCTGAG CCCCCGTGGT 
GCGTTGCGCC TGGTCGGCGA CACGGCCAGA GCAATCCCGT CAGGAGCGGC GTTGATTCGT 
CGCTGCCAGC CAGACGTGGT GATCGCCAAC ACGATCACCA TCCCGTTGTG GACATTGTTG 
GGGCGGATGT TGCGCCGGCC GGTCCTGGTC CATGTGCATG AGGCCGAAGG TTCGGTTTCC 
ATGGTTCGGC AACGGGTGAT GGCCGCGCCC CTGCTGCTGG CCACTGCGCT GGTGGCCAAC 
AGTCGATGGA CTCGGGACGT GCTGACCAGG TCGTTCGCGC GCCTGGGACC GCGGACCTCG 
GTCATTTACA ACGGAGTGGC CGGGCCCGCC TCTCCGGTGC CACCTCGACC GGCAATCCAA 
GGATCGGCGA GGTTGCTGTT TGTCGGCCGA CTTTCCCCCC GAAAGGGTCC CGCCATCGCG 
ATCCAGGCAT TGGCGCACCT GCGCCGTCGA GGAACGCCGG CCAGTCTGGA TGTGGTCGGT 
GATTCGTTTG CCGGCTATGA ATGGTTCGCT GACGAACTGA GGCGGTTGGT GCAGCTGGAG 
GGAGTGGCAG ACGCTGTGCG TTTTCATGGC TTCGTGTCGG ATATCTGGCG GCAAATGGCG 
CAGGCCGACG TCGTGCTGGT TCCGTCGCAG GCCGACGAGT CTTTCGGCAA CAGTGCGATC 
GAGGCCGTCC TGGGCGCCCG TCCGCTGGTG GTGACCCAGA TCCAGGGGCT ACTCGAGGCA 
ACCGAGGGAT TCGCGGCCGT GAAGTCGGTG CCTCCCGGTG ATGCCGATGC CCTGGCCGGC 
GGGATCGACG AGATCCTTTC CGAATGGTCG AGATTCGCCG AGCTGGCCGA ACGCGACGCC 
CGGATCGCCG TCGAGCGTTT CGCACCGGCC CGCTACCGCC GCGACATGCT GGCCCGGGTT 
GCCGGACTGG TCCGACCATG A

Protein sequence

MPPVGSGSGR RALVVHPGAD LYGSDRVLLE TVGALVEAGW AVTVSVPAAG PLVAVLVHRG 
ASVQVCPTPV LRKSVLSPRG ALRLVGDTAR AIPSGAALIR RCQPDVVIAN TITIPLWTLL 
GRMLRRPVLV HVHEAEGSVS MVRQRVMAAP LLLATALVAN SRWTRDVLTR SFARLGPRTS 
VIYNGVAGPA SPVPPRPAIQ GSARLLFVGR LSPRKGPAIA IQALAHLRRR GTPASLDVVG 
DSFAGYEWFA DELRRLVQLE GVADAVRFHG FVSDIWRQMA QADVVLVPSQ ADESFGNSAI 
EAVLGARPLV VTQIQGLLEA TEGFAAVKSV PPGDADALAG GIDEILSEWS RFAELAERDA 
RIAVERFAPA RYRRDMLARV AGLVRP