Gene Mmar10_1688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1688
Symbol
ID	4285691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	1855701
End bp	1856966
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	65%
IMG OID	638141176
Product	O-antigen polymerase
Protein accession	YP_756918
Protein GI	114570238
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0910283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.076767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCG CCGCGCACCA TGATCCGGCT TTCCTCGCTG CCTGGCGCCG CGCACCGGCA 
CTACCTTTCA CCGGACTGGT TGAAGGTGGG CTGACGCTTC TTTGCCTCTT CCTGTTCTCG 
CAAGGCCTGA TCGGCCCGCT CTTCGCCGAT CCCGCTGACC CGGACAGCTC AGTTGTGCTG 
CGCCTCATCT GGCTGCCAGT CTATGCCATC ACGCTGGCGC TCGCGGTGAC GCGGCCGGGG 
GCCGTGATGC GGACGCTGAC AGGCAATTGG TTGATGGTGG CGCTGGTCCT GTTGACTGCG 
GTCTCCGTCA TCTGGTCGAT CGCGCCAGAG ACGACCCTGC GCCGTTCCTT CGCCCTGATC 
ATGACCACCC TGTTCGGCTT CTGGATGGCC GCGCGCTGGT CCTGGCGCGG CCTGATCCTT 
CTGACTGCGA CAACCTTTGT CGGCCTCGCT GTTGTGTCGA CACTGATGGC GCTGGCCATG 
CCGTCCCTGG GTGTTGACCA CGAAGTCCAT GCCGGCGCCT GGAAGGGCGT GTGGTGGGAG 
AAGAATACGC TGGGCGCCAT GATGGCCTGG GGGGCGGTGG CCTGTTTTGC GGCGCTGCAT 
GTCGATCCCC GACGGCGCTG GATCTGGATG GGCGGGGCGA TCCTGTGTTG CGCCCTGGTC 
CTGCTGTCGA CCTCCAAGAC CGCGCTTCTC GCGCTGCTAC TCGGGATTGG CGGCGCTGTC 
GGGATCGCGC TGTGCCGGCG CGGCTTCGGC TTTGCCAGCC TGATGCTGTT TCTCGGCCTG 
ACCGGCGCGG TTGGTGGTGC CCTGATCCTG TTAATAGCAC CCGTTGAGTT CCTGGAGCTC 
CTTGGTCGCG ATGCCACGTT GACCGGCCGG ACGGATATCT GGGCCATCCT GTCGCGCCAG 
GCCGCGGAAG TTCCGTGGAC GGGCTATGGC TATATGGCCT TCTGGGCCGA TGAGACAGGG 
CCGGTTTACT GGGTCAGGCA GGGCACGGAC TGGCCGGTCC CGACTGCCCA TAATGGCTGG 
ATCGAGACGG CGCTGGCGAT CGGCCTGCCG GGTGTCGTGC TGTTGGGTCT GGTCTATGGG 
CGCGCAGTAA TGCGGTCCCT TGGACGTTTG TTCCATGGGC CGGAAACCTA TTGGACACTG 
ACTTTTCTGG CCATGCTGGG CCTGGTCAGC ATCTCTGAAT CCAACTTCCT TCAGCAGAAT 
TCGATCGGCT GGGTCCTGCT CGTCGCGACG GCTGCCAAGT TGGCAGACCG ACGGGCCGGC 
GACTAG

Protein sequence

MSLAAHHDPA FLAAWRRAPA LPFTGLVEGG LTLLCLFLFS QGLIGPLFAD PADPDSSVVL 
RLIWLPVYAI TLALAVTRPG AVMRTLTGNW LMVALVLLTA VSVIWSIAPE TTLRRSFALI 
MTTLFGFWMA ARWSWRGLIL LTATTFVGLA VVSTLMALAM PSLGVDHEVH AGAWKGVWWE 
KNTLGAMMAW GAVACFAALH VDPRRRWIWM GGAILCCALV LLSTSKTALL ALLLGIGGAV 
GIALCRRGFG FASLMLFLGL TGAVGGALIL LIAPVEFLEL LGRDATLTGR TDIWAILSRQ 
AAEVPWTGYG YMAFWADETG PVYWVRQGTD WPVPTAHNGW IETALAIGLP GVVLLGLVYG 
RAVMRSLGRL FHGPETYWTL TFLAMLGLVS ISESNFLQQN SIGWVLLVAT AAKLADRRAG 
D