Gene Namu_5250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5250
Symbol
ID	8450881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5860163
End bp	5861173
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	59%
IMG OID	645044281
Product	O-antigen polymerase
Protein accession	YP_003204505
Protein GI	258655349
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCCT GTGCCGTGCT GTTCGCCGTC CTGGCTCTTT CGAGCCTGTG GAGCGAGGCG 
GGCGAGGCGA CGTGGTTGCA GCTGATGTGG ATCGTCCTGA TGCTGGGGGT TCTCTGTGTA 
GTCTCGGCGG CAGCGCAGTT GTCGCCGAAG GTGGCTGTCG ATACTTTCAT GTTGCTGAGT 
GCGGTGACCG GCATTATCTT CGCGGTTGGT GGCTTGGTCC TCGGTGGCTC AGGTGCGCGT 
TTGGCCGCAT TTGGGGGAGG CCCCAACGTC TTTGCTCGCA TCACCGGTAT CGGCATTATC 
GCCGCCGTCT TCTGGATGCT GAGAGGCAAG AGAGGCTGGC CAGCGCTGCT TGCCTTCATT 
CCCGTCATGG CCGTTGCCAA TATCTTGTCC GGGTCGCGCG GGGCTTTGAT CGGAACTGTA 
TGTGGATTGC TGGTGGTTTG TGTGGCCTTC TCCTGGCGAA CCTGGTTGAA GTTTGGATTA 
TGCACGGTGG TGGCCTCGCC GATTCTCTTC ATCCTGTACG GCCAGTACGG AGCCAACGTT 
GAGAAGGTCG TTGCCTTGCG AATCGTCAAG CTAACCTTTG AGGAGGGCTA TACCTCCGGC 
CGTGACACGC TCTGGGAGCA TGCGACTTCG TCGATGTCGG AGAACCCTGT CTTTGGGACT 
GGTCTCGGAT CCTTCATGAC CAACAATGGC TTCTACACAC ACAACCTATT CCTGCAGGTC 
GGTGTAGACG CAGGCTTGTT GGGCTTGGCT GTCTTGACGG TCGCACTGCT CGTGCTGGTT 
AGAGGCTTGT GGACCAAGAA TACCCGCTCA CCGGTAGTTC TGGGACCGTT GGCAGCCGGC 
ACCACGATCT TTGTTGCGTC GATGGTTTCG GGCGATCACT ATGACACAAG ATTCTTCTGG 
GCTTATCTGA TCCTTGCCTG CGCAGCAGCG GGGCGCATCC GCTCCAAGAC GAGTGGAAAG 
GCCGGGGCAT GCAGCTCCGA GCCGACGGAA GTGCCCCCTC ACAGGATCTA G

Protein sequence

MLACAVLFAV LALSSLWSEA GEATWLQLMW IVLMLGVLCV VSAAAQLSPK VAVDTFMLLS 
AVTGIIFAVG GLVLGGSGAR LAAFGGGPNV FARITGIGII AAVFWMLRGK RGWPALLAFI 
PVMAVANILS GSRGALIGTV CGLLVVCVAF SWRTWLKFGL CTVVASPILF ILYGQYGANV 
EKVVALRIVK LTFEEGYTSG RDTLWEHATS SMSENPVFGT GLGSFMTNNG FYTHNLFLQV 
GVDAGLLGLA VLTVALLVLV RGLWTKNTRS PVVLGPLAAG TTIFVASMVS GDHYDTRFFW 
AYLILACAAA GRIRSKTSGK AGACSSEPTE VPPHRI