Gene Mext_4786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4786
Symbol
ID	5835204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	5345830
End bp	5347290
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	71%
IMG OID	641370583
Product	O-antigen and teichoic acid-like export protein
Protein accession	YP_001642225
Protein GI	163854182
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.315626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.636766
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCA TCGCCGCCTT CGTCCTCAAT GCCGGGCTGA ACTTCATCCT CGGCATCGCC 
ATCGCCCGAA TGCTGGGGCC AGCCGATTTC GGCCGTTTCG CCCTGGCGAC GGCCGGCGCG 
GTCGTGCTCA ACACGATCCT GTTCGAGTGG CTGCGGCTCT CGGCGACCCG GTTCTACTCG 
GCGCGGGTGC GCGAGGCCGA GCCGTGGATC CGCCAGGGGC TGGACCGGGC TTACTGGGTC 
ATCGCGCTGG CGCTGTTTGC CACGGCCGCC CTCTGCGCCG GGCTCGGGAT CGCCGTCAAT 
CCGACCCCCG AGGGACGTCT GGTCATGACC GCCGGCACCA TGGTCGCGGC GATCGGCATC 
GGGCTGTTCG ACTATCATGC GGCGCTCGCC CGCGCCCGCT TCATCGGCAG CGCCTATCTC 
CGGCTCGTGG TGTGGAAGAA CGTCCTGGCC TTCGTGCTGA TGGCCGGCAC GGCATGGCTG 
TTTCCGCAGC CGGTCTGGGT GCTGATCGCA GGGGGCTTGA GCCAGTTCCT GGCGGTGCTG 
CCGATGCGCA AGATCCTGGG CGACGGGCTT TTGGGGCACG TGCCCGCCCT GCCCCATGGC 
CGAGCTCGTG AAACTCTGCG CCTGTTCGCG GCCTACGGCC TGCCCTTGAT CGCGGCCAAC 
GCCGTCTATC AGATTATGCC CTTCCTCAAC CGCGCCGCCA TCGCCGGCAC GGCCGGCTTT 
GCCGAGGCCG GCTATTTCGC GCTCGCCGCC GATCTCGGCT CGCGGGCCTT CTCGACGCTC 
GGGGCCGCGC TCGACCTGCT GCTGTTCCAG ATCGCCGTGC AGGCCGAGGA GCATCATGGC 
CGCGAGGCCG CCGAGACCCA GGTCGCGCGC AACATCGCCA TCGTGGTGGC GCTGCTCCTG 
CCCTGCGCCG CCGGCTACTG GGCCGTGACG CCGGCCCTCC AGGCGCTGAT CGTGCCGGCG 
GAGTTTCGCG GGCCGTTCGC GGACTACACC GACCTGCTGA TCCCGGGCCT GTTCTGCCTC 
TCGATCATGA ACTTCGCCCT CAATCCCATC TTCCAGATCC GTCGCCGGAC GAGCCCGGTG 
GTCGCCGCCG CGCTCATCGG GCTGGCCGTC AACGCCGTCG GCCTCGTCTT GCTGCCGCGA 
ATGATGGGAC CGCAGGGCGT TGCTGTTGCG CAGACCCTCG GCCTCGTCGC GGCGGTCGCC 
GTGCTGGGCC TGCGGGCGCT GACGGGGATC GAGCGCCTGC GCCTGCCGGG CCGCGACCTC 
GCCCTCACCG CCGCCGCCTG CCTTGCCATG GTTCTGGCCG TGCTGCCGTT CCGCGGCTTG 
GAGCCGGCGC TCGCCCTGCC CGCCTGCATC GCGGCCGGAA TGCTCGTCTA CGGCGCCCTC 
GTCTGGTTCC TCGACATCGC CGGCCTGCGC AGCGCCGTGC GCCAGCGTTT CCCGAAGCGG 
CTGCCGGCCG CCGCGCGGTA G

Protein sequence

MAVIAAFVLN AGLNFILGIA IARMLGPADF GRFALATAGA VVLNTILFEW LRLSATRFYS 
ARVREAEPWI RQGLDRAYWV IALALFATAA LCAGLGIAVN PTPEGRLVMT AGTMVAAIGI 
GLFDYHAALA RARFIGSAYL RLVVWKNVLA FVLMAGTAWL FPQPVWVLIA GGLSQFLAVL 
PMRKILGDGL LGHVPALPHG RARETLRLFA AYGLPLIAAN AVYQIMPFLN RAAIAGTAGF 
AEAGYFALAA DLGSRAFSTL GAALDLLLFQ IAVQAEEHHG REAAETQVAR NIAIVVALLL 
PCAAGYWAVT PALQALIVPA EFRGPFADYT DLLIPGLFCL SIMNFALNPI FQIRRRTSPV 
VAAALIGLAV NAVGLVLLPR MMGPQGVAVA QTLGLVAAVA VLGLRALTGI ERLRLPGRDL 
ALTAAACLAM VLAVLPFRGL EPALALPACI AAGMLVYGAL VWFLDIAGLR SAVRQRFPKR 
LPAAAR