Gene Mext_4583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4583
Symbol
ID	5833954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5120271
End bp	5121623
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	71%
IMG OID	641370377
Product	polysaccharide biosynthesis protein
Protein accession	YP_001642022
Protein GI	163853979
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.358999
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAAG CCCACACCGC GCCCGTCCCG CCGGCAGGCC TGCTCCGGCG CGCCGCCGGC 
CTCGTCCGGC GCCCGCCGGC CGCGCTCGCC GCCCTGGCTG ACCAGGGCGT CGTCAGCGGC 
TTCGGCTTCC TCAGCGGCAT CGTCGCCGCC CGCCTGCTCG GCATCGCCGA GTTCGGGCAT 
TTCGCGATGA TCCTGATCGT GCTCACCTTT GCGCAGGCCC TGCACAACGC CCTCATCACC 
GCGCCGATGA TGACGCTGGT CGGCGCCCGC AGCGGCGTCT CGAAGGCCTA TGCCGCGACC 
ATTCTCACCG GCGCCTTCCT GCTCTGCGTG CCCGGTGCGG TCTTCGTGGT GATCGCCCTC 
CTCATCGGCG GGATGTCGGG CGAGACGCTT GTGGCGGCCT GCGCCCTGAT GCTGGCGCAG 
AACCTTCAGT TCACCCTGCG CCGCCTCCTG TTTGCGAAAG GTCGGGGCGT GCAGGCCCTG 
CTCATGGATT TCGCCCGCGC CGCGAGCTTC CCCTTCATCG CCCTGGTGAT CTGGCTTGAG 
CACGACGTCA TCGGCAGCAA CGGCTTCGTC TGGCTGCTCG CCGCGACCTC GTTCGCGACC 
TGCCTGCCCT TCATCGTTGC GTTCGGCCGG CCGATCCTGC GCCGGCCCGG CTGCGTGCAG 
ACCGGCGCGG TCTTTCGCCG TCACATCCCG CTCGCGCGCT GGCTCCTGCC GATCGTCTTC 
GTCACCTTCG TCCAGGAACA GCTCATCTGG CTGGTGGCGG GCGCGACGCT GGGGCTGGAG 
GAACTCGGCG GCCTGCGGGC GGCGCAGTAC CTCGTCGGGA CCGTGCTGCT GCTGCTCGCC 
GCCACGGAGA ACGTCCTGCC GGTGGCCGCC GCGCGCGCGC ATTCCGAGGG CGGGGAGGCG 
GCCCTGCGCC GCTACCTCAT GCGCACGGGC GTCAAGCTCG GGGTGCCGAT CATCGCGATC 
CTCGCGATCC TCGCCATTCC GGGTGCGATG TGGCTGCGCC TGATCTTCGG GGCGGAATAT 
GCGGCCTATG CCAACTGCCT GCACATCCTC TCGGTCAGTG TCGTGATCGT GCTGGCCCGC 
GACCTCACCG CGAACTACTT CCGCGCCAAG CAGAACACCC GGGTGCTGTT TGCCTCGCTC 
TGCGTGAGCA TGGTCGTGTC GCTCGCCGTA GTGGTCCCGC TGATGCAGGC CGGCGGCGTC 
AGCGGCGCCG CGGCGGCGGT GGGGGCGGGG CACCTCGCCT CCCTCATCTA CCTCGTGCTG 
GCCGCGCGGC GGCAATCGCG CCCGGCCTCG GCCTGGCCGA TGCCGGGCCG GTGGCGGCGC 
TCGCTCAGGC CGGCCAAGTC GGCGCAGACC TGA

Protein sequence

MPEAHTAPVP PAGLLRRAAG LVRRPPAALA ALADQGVVSG FGFLSGIVAA RLLGIAEFGH 
FAMILIVLTF AQALHNALIT APMMTLVGAR SGVSKAYAAT ILTGAFLLCV PGAVFVVIAL 
LIGGMSGETL VAACALMLAQ NLQFTLRRLL FAKGRGVQAL LMDFARAASF PFIALVIWLE 
HDVIGSNGFV WLLAATSFAT CLPFIVAFGR PILRRPGCVQ TGAVFRRHIP LARWLLPIVF 
VTFVQEQLIW LVAGATLGLE ELGGLRAAQY LVGTVLLLLA ATENVLPVAA ARAHSEGGEA 
ALRRYLMRTG VKLGVPIIAI LAILAIPGAM WLRLIFGAEY AAYANCLHIL SVSVVIVLAR 
DLTANYFRAK QNTRVLFASL CVSMVVSLAV VVPLMQAGGV SGAAAAVGAG HLASLIYLVL 
AARRQSRPAS AWPMPGRWRR SLRPAKSAQT