Gene Mext_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0040
Symbol
ID	5835560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	46285
End bp	48720
Gene Length	2436 bp
Protein Length	811 aa
Translation table	11
GC content	60%
IMG OID	641365824
Product	putative phosphoketolase
Protein accession	YP_001637539
Protein GI	163849496
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3957] Phosphoketolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.383665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCGA TCCTCAAAGC TCGGCGGCAG CCCAAGCGCA CGGCGCGGAC ATCCGAGCTG 
GCCCTGATCG ATGCCTACTG GCGGGCGGCA AACTACTTGT CGGTCGGTCA GATCTACCTC 
TACGACAACC CGCTACTGGT GGAACGACTG ACCAAGGAGC ACATCAAGCC GCGTCTACTC 
GGCCACTGGG GAACCACTCC GGGTTTGAAT TTCATCTATG TTCATCTGAA TCGTCTTATT 
AAAAAGCATG ATCTTGATGT TATCTATATT ACAGGGCCGG GGCATGGCGG TCCTGCCTTG 
ATCGCCAACG CATACCTCGA GGGGACTTAC AGCGAAGTCT ATCCGAACAT CTCCGCCGAT 
GCTGAGGGCA TGAAGCGCCT CTTCAAGCAG TTCTCCTTCC CAGGCGGCAT CCCGAGCCAT 
GTGGCTCCTG AAACACCGGG CTCGATGCAC GAAGGCGGAG AGCTGGGCTA TTCCCTCTCG 
CACGCCTACG GCGCCGCGTT CGACAACCCC GACCTCATCG TCGCTTGCGT CGTCGGCGAT 
GGCGAGGCCG AGACCGGGCC TCTTGCCACA AGCTGGCATT CGAACAAATT TCTCAACCCC 
GTGAGCGATG GGACGGTTCT GCCGATCCTG CACCTCAACG GGTACAAGAT TGCCAACCCG 
ACTGTACTGG CCAGAATTAG CCACGCGGAG CTTGAACATC TCTTCCGTGG GTACGGGTAC 
ACCCCCTACT TCGTGGAAGG ACATGATCCG GCCGAGATGC ACCAGCGCAT GGCCTCCACC 
ATGGATGCTG TCCTGCGGGA CATTCGCCGG ATCAAGTCGG ACGCGCGCGA CAAGGGTTTC 
ACGGGCCGGC CGTTCTGGCC GATGATCGTT CTTCGGACGC CAAAAGGATG GACATGTCCG 
AAGGAAATCG ATGGACGGCG CACAGAGGAT TACTGGCGCT CGCACCAAGT GCCAATGGGC 
GAGATGCACG ACAATCCCGC CCATGTGCGC ATGCTCGAAG ACTGGATGCA ATCTTATCGG 
CCCGCCGAGC TCTTCGACGA AGGCGGCCGA CTTCGCTCGG AACTTGCCGA GCTTGCCCCG 
ACGGGCGACC GCCGCATGAG CGCCAATCCG CATACCAATG GAGGCACTCT GCTCCGCGAC 
CTGCGGCTCC CGGATTTTCA CGACTATGCA ATACCGGTGA CCGCCCCCGG TGCCGCCGTC 
GCCGAGTCCA CGCGCGTGAT GGGACGCTTC CTCCGCGACG TCATGGACCT GAACGCAGAA 
GCGCGAAACT TCAGGCTGTT CAGTCCGGAC GAGAATAACT CAAATCGCTG GCAGGACGCG 
CTCGAGGTGA CCAACCGCGC CTGGGTGGCC GAGACGTATC CCTGGGATGA TCACCTCGCG 
CATGACGGCC GCGTGATGGA GATGCTGAGC GAGCATCAAT GTCAGGGCTG GCTCGAAGGC 
TATCTGCTGA CGGGTCGGCA CGGCTTCTTC TCGTGCTACG AGGCCTTCAT CCACATCATC 
GACTCGATGT TCAATCAGCA CGCCAAGTGG CTGAAGGTCT GCAACCATAT TCCGTGGCGG 
CGACCCATTG GGTCTTTGAA CTACCTTCTC TCCAGCCACG TCTGGCGTCA GGATCACAAC 
GGGTTCAGTC ATCAGGATCC AGGCTTCATC GACCATGTCG TGAACAAGAA AGCCGAGGTC 
GTTCGTGTCT ACTTACCACC GGATGCGAAT TGTTTGCTTT CCGTAACCGA TCACTGCTTG 
CGAAGCCGCA ACTACGTCAA CGTGATCGTC GCGGGTAAAC AGCCAGCACC CCAGTGGCTC 
ACGATGGATC AGGCGGTCAA GCACTGCACC GCCGGGCTTG GGATCTGGGA ATGGGCGAGC 
AACGACCGCG GCAGCGAGCC GGACGTCGTG ATGGCGTGCT GCGGGGATGT GCCGACCCTT 
GAAACGCTCG CGGCCGTCGA CCTCCTCCGC TGCCATGCGC CGGATCTCAA GGTGCGCGTC 
ATCAACGTCG TGAACCTGAT GAAGCTGCAG CCCGACACGG AGCATCCACA CGGCCTGTCA 
GATCAGGATT TCGATGCCCT GTTCACGACG GACAAACCGG TCGTCTTCGC CTTTCACGGG 
TATCCTTGGC TCATTCACCG GCTGGTTTAC CGACGTCACG GACACAGCAA CTTCCATGTG 
CGTGGCTACA AGGAGGAAGG CACGACGAGC ACGCCGTTCG ACATGTGCGT GATGAACGAC 
ATGGATCGGT TCCATCTCGT CAGCGATGTC ATCGACCGGG TGCCGGGCCT GGCCGCTCGG 
GCGGCCTACG CCAAGCAAGC GATCCGGGAC AAGCTAATCG ACCATCGCGC GTACATTCAT 
CGGCACGGCG ACGACATGCC GGAAGTATCC GGCTGGTCCT GGAGCCCGAT GGCGACGACG 
CGCGGTCTCG GCTCGACGGA GAGTGACAAT GTGTGA

Protein sequence

MDAILKARRQ PKRTARTSEL ALIDAYWRAA NYLSVGQIYL YDNPLLVERL TKEHIKPRLL 
GHWGTTPGLN FIYVHLNRLI KKHDLDVIYI TGPGHGGPAL IANAYLEGTY SEVYPNISAD 
AEGMKRLFKQ FSFPGGIPSH VAPETPGSMH EGGELGYSLS HAYGAAFDNP DLIVACVVGD 
GEAETGPLAT SWHSNKFLNP VSDGTVLPIL HLNGYKIANP TVLARISHAE LEHLFRGYGY 
TPYFVEGHDP AEMHQRMAST MDAVLRDIRR IKSDARDKGF TGRPFWPMIV LRTPKGWTCP 
KEIDGRRTED YWRSHQVPMG EMHDNPAHVR MLEDWMQSYR PAELFDEGGR LRSELAELAP 
TGDRRMSANP HTNGGTLLRD LRLPDFHDYA IPVTAPGAAV AESTRVMGRF LRDVMDLNAE 
ARNFRLFSPD ENNSNRWQDA LEVTNRAWVA ETYPWDDHLA HDGRVMEMLS EHQCQGWLEG 
YLLTGRHGFF SCYEAFIHII DSMFNQHAKW LKVCNHIPWR RPIGSLNYLL SSHVWRQDHN 
GFSHQDPGFI DHVVNKKAEV VRVYLPPDAN CLLSVTDHCL RSRNYVNVIV AGKQPAPQWL 
TMDQAVKHCT AGLGIWEWAS NDRGSEPDVV MACCGDVPTL ETLAAVDLLR CHAPDLKVRV 
INVVNLMKLQ PDTEHPHGLS DQDFDALFTT DKPVVFAFHG YPWLIHRLVY RRHGHSNFHV 
RGYKEEGTTS TPFDMCVMND MDRFHLVSDV IDRVPGLAAR AAYAKQAIRD KLIDHRAYIH 
RHGDDMPEVS GWSWSPMATT RGLGSTESDN V