Gene Mext_2224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2224
Symbol
ID	5834286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	2468643
End bp	2469947
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	73%
IMG OID	641368023
Product	glycosyl transferase group 1
Protein accession	YP_001639690
Protein GI	163851647
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.307523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGTCG TGATCCTCGC CGAATTCGCC GCCGCGAGCG GGGGTGCCGA GAAGGTCGCG 
GTGGAATCCG CCCGCGGGCT CGCCGAGGCC GGCGCAACGG TGACCTACAT CCAGGCGATC 
ACCGGACCCG TCGATTCGCT GCTCGACCAT CCGCGCCTGC ACCGCATCGA CCTCGCTCTG 
CCGGATGTGT GGTCGCTGGC GGCATGGCGC GGCGCGGCGT CGGGGATCTG GAACGGCGAG 
GCCGCCGCGC GCCTCGCGAG TGCGCTCGAC AGCCTGCCGG TGCCGCCCGA CTGCCTTCAC 
CTGCACCAGT GGACCCGCGC GCTCTCGCCC GCCGTGCTGC CGGTGCTGCT CAGCCGCGGC 
GTTCCCCTGG TGCTGACGCT GCACGACTAT GCCCTCACCT GTCCGAACGG TGTCGATTAC 
CGCTTCGATC GGGCCGAGCC CTGCGCGCTC GTCCCGCTGT CCGGCGCCTG CCTCGCGGCC 
GCCTGCGATC CGAAGAGCCG GCGGCACAAG CTGGTGCGGG TCGGTCGCGC CGCCGCCCTG 
CGGGTCGCGG CGCGAGGGGC CGATCTCGAC GTCGTCCATG TCTGCGACGG CAGCCATGCG 
CGGGTGGCGG GACGGTCCGG GGCCCTGCGC CTGCGCCATC ACCGCATCGA CAACCCGGTG 
CGGGTGGAGA AGCGGGCGCC GGCCCTGCCG GCTTCGGGCG ATGCGATCGT CTATGTCGGG 
CGCCTAACGC CGGAGAAGGG CGCGGATCTC GTCGCCGAGG CCGCGCGGCG GGCCGGACTG 
CCCGCGCTCT TCATCGGGGC CGGCCCGCTC GAAGCACGTC TGCGGGCGGA GGGCGCCGAG 
GTGCTCGGCT GGCGAAGCCC GGAGGCGGTC GAGGCGATCC TGCATCGCCG CGCGCGTGCG 
CTCTGCGCAC CGTCGCGCTG GGTCGAGACC GGGCCGCTCA CCGTCTACGA GGCGCTGGCC 
CAGGGGATTC CCGTTGTGGC GTCGCGGCGC TCCGGCGCGG CGGAGAAGGT GGCGGACGGG 
GAGACCGGCT TCGTCGTCGA GCCTGAGGTG GCGGCGCTGG CCGATGCCTT CGCGGCGCTC 
AAGGCCGACG CGCTGACCGC CCGCCTCGGC CGGCAGGCCT ATGACCGGTA CTGGCAGGCC 
CCGCTGACGC TCGCCGCCCA CGCGCTTTCC CTGCTGACGC TGTATCGGCG GATTGGGGAT 
GAATACAAAA TGCGGCAGTG CGATATGAGC CCGGCTACCG CCGAGCCTGC GGTTGTCCAT 
TCCATGGGCA GCACCCTTGG CAAAGGGCGC CTTCCGACAT TATAG

Protein sequence

MHVVILAEFA AASGGAEKVA VESARGLAEA GATVTYIQAI TGPVDSLLDH PRLHRIDLAL 
PDVWSLAAWR GAASGIWNGE AAARLASALD SLPVPPDCLH LHQWTRALSP AVLPVLLSRG 
VPLVLTLHDY ALTCPNGVDY RFDRAEPCAL VPLSGACLAA ACDPKSRRHK LVRVGRAAAL 
RVAARGADLD VVHVCDGSHA RVAGRSGALR LRHHRIDNPV RVEKRAPALP ASGDAIVYVG 
RLTPEKGADL VAEAARRAGL PALFIGAGPL EARLRAEGAE VLGWRSPEAV EAILHRRARA 
LCAPSRWVET GPLTVYEALA QGIPVVASRR SGAAEKVADG ETGFVVEPEV AALADAFAAL 
KADALTARLG RQAYDRYWQA PLTLAAHALS LLTLYRRIGD EYKMRQCDMS PATAEPAVVH 
SMGSTLGKGR LPTL