Gene Emin_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1087
Symbol
ID	6263213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1178573
End bp	1180411
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	36%
IMG OID	642611567
Product	O-antigen polymerase
Protein accession	YP_001875976
Protein GI	187251494
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	95
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAG TAAAACAAAT ATTAAATTTT GTTTTTTACG CGGGCGCTTT TGTTATCGCC 
CCTTTGTTTT TCTTTACGGA TTTAACCCAA AATCCGTTTC AAATACAAAC AAATGTTTTG 
ATGTTTTCTT TAACGGGGAT TTTTATAATT AACGCTAAAG ACTTTCTTGT AAATAAGCAA 
GATAAAGCGT TTTTCTTTTT TATAGCCGTA TTGTTTTTAA CGTGGTTTAT TTCCTTGCTT 
TTGGCTAAAA ATTATTATGA GACAATAAAA TACTCTATTC TTTCAAACGG TTTTATTTTG 
TTTGTATGGG CGGCATCCTA CGTGGCGGGC AAGAGTATAA AAGAAAACGG CTCGAACTTA 
AAATTAAAAA CTGTTATTAA CACTCTTCTT ATAACCGGGT TTATAGCCGC GTTTTACGGG 
TTAGCGCAAA AAGCAGGGGG GGAGGTAATA TGGCCGGGTA ATATCCGCGC CGGGGTTATA 
AGCACATTCG GAAACCCAAA CTTTTTATCT TCTTTTTTAG TTGTACTGTT TTTCCCCGCT 
TTGTATTTGT TTTTAGAAAA TAATAAAAAA GCTTTTTACG GCGTTGTTTT GCTTGTTTAC 
GCTTTGTTTA TTATATTATG CGGGGCAAGG TCCTCTTTAC TCGCTTTAGC CGGCGGTATG 
GTTTTATTTC TGGTTTACGC GCCTTTCAGA AGCTATATAA AACAAAATAA AAAACAACTT 
GGTATTTTTG CGCTTATTTT GGTTGTTATT TTGACTGCTT TCCCGGCGCA AAATAAATTT 
TCCAAAATAA ATGAAGTTAA AGATATTTTA AAAACCGAAA GGCCCATGGT TCAAAGCTAT 
GACCAGCGTA TAATGCTTTG GAAGGGCGCT TTTAAAATTT TTACCTCAAA CCCCGCGGCC 
GGGGCGGGGT GGGGCAACTT TCAGCTTTTT TACGCCGTAA AGCAGGGGGA ACTCCTTGCC 
CAAAAGCCTG ATTTATATGT ATTTAAAGTG CAGGGTAATG CGGCGCACAA TTTTATTTTT 
CAACTGCTTG CCGAAAGCGG CGTTTTAGGC CTTGCAACTT TTATATTTTT TGTTGTTATC 
TTTGGTAAAA GAAGTGTTAG TTACTTTACT AAAAAAACTA AAAATAGAGA TATGGTTTTT 
GCTTTGCTTG TGTCTTTGGC GGCGATGTTT GCTGATAATA TGCTTAACAT TACGCTTTTT 
ATAACAATGC CCGCTTTTTT ATTTTTCTTT ATCTTAGGCA TTCTGTCTTC TGAAATGGAG 
GAAGGCAAAC CGGCCCCGGT TATTTGCTGT ATATTTATAT TTATTTTCAC CGCCGCTTTG 
TTTTTTGACA TAAAAATATT TATATCATCC GTAAAAGAAC ATAAGGCGGT AAGGGTTTTT 
AATAAAAACA ATTACGTCTT GGCAAAGGAA TATTTTACTT CCGCCCATAA CGCTTACGGC 
GGTAATTATA ACGCCCTTCT TTTACGGGGT AAAATAAACG CCGTGTTTAA AGAAAATAAA 
GCCGCTTTTG AGGATTTTGC CGCTGCTTCC GTCATAAACT CAGCTTATGA CGAGCTTTTT 
TATAACGCGG CTTTGATGGC CTATTCTTTA GAAAAGTACC AAGACTCTTA CCAAAATACC 
ATTGCGGCCA TTGAGCTTAA CCCCGTAAAA AGCGATTATT ATGTACTTTT ATTAAACATC 
TTGCAGCGTG ATAAAAAAAC CGTAAACGCG GATTCTAAAA AAATATTTTT AACGCTTGAA 
AAAATATTGA AAAACACTTC TGAAGAAAGT GAAAATAAAG AAATTATAAA AGCCGTTCTT 
GCCGAAATAA AAAATAAACA AATATTTGAC AAAGCATAA

Protein sequence

MNKVKQILNF VFYAGAFVIA PLFFFTDLTQ NPFQIQTNVL MFSLTGIFII NAKDFLVNKQ 
DKAFFFFIAV LFLTWFISLL LAKNYYETIK YSILSNGFIL FVWAASYVAG KSIKENGSNL 
KLKTVINTLL ITGFIAAFYG LAQKAGGEVI WPGNIRAGVI STFGNPNFLS SFLVVLFFPA 
LYLFLENNKK AFYGVVLLVY ALFIILCGAR SSLLALAGGM VLFLVYAPFR SYIKQNKKQL 
GIFALILVVI LTAFPAQNKF SKINEVKDIL KTERPMVQSY DQRIMLWKGA FKIFTSNPAA 
GAGWGNFQLF YAVKQGELLA QKPDLYVFKV QGNAAHNFIF QLLAESGVLG LATFIFFVVI 
FGKRSVSYFT KKTKNRDMVF ALLVSLAAMF ADNMLNITLF ITMPAFLFFF ILGILSSEME 
EGKPAPVICC IFIFIFTAAL FFDIKIFISS VKEHKAVRVF NKNNYVLAKE YFTSAHNAYG 
GNYNALLLRG KINAVFKENK AAFEDFAAAS VINSAYDELF YNAALMAYSL EKYQDSYQNT 
IAAIELNPVK SDYYVLLLNI LQRDKKTVNA DSKKIFLTLE KILKNTSEES ENKEIIKAVL 
AEIKNKQIFD KA