Gene Mpe_A1889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1889
Symbol
ID	4786769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2023635
End bp	2024951
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	65%
IMG OID	640090459
Product	isocitrate lyase
Protein accession	YP_001021082
Protein GI	124267078
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0265968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAC CGACCCGTGA ACAACAGATC GCCGCCCTCG AGAAAGATTG GGCGGAGAAC 
CCGCGCTGGA AAGGCCTGAA GCGCGGCTAC AGCGCTGCCG ACGTGGTTCG CCTGCGCGGC 
AGCCTGCAGC CCGAGTACAC GATCGCCAAG CGCGGCGCCG AAAAGCTGTG GGCACAGTGC 
AACGGCGCGT CGAAGAAGGG CTACGTCAAT GCCTTCGGCG CGATCACCGC CGGTCAGGCG 
ATGCAGCAGG CCAAGGCCGG CGTCGAGGCC GTGTATCTGT CAGGCTGGCA GGTTGCCGCC 
GACGGCAACA CCTCCGAGAC CATGTATCCC GACCAGTCGC TGTACGCCTA CGACTCGGTG 
CCGACCATGG TCCGCCGCAT CAACAATACC TTCAAGCGCG CCGACGAGAT CCAGTGGTCG 
CGCGGCACGG GCCCCGGCGA CAAGGACTTC ATCGATTACT TCCTGCCGAT CGTGGCCGAT 
GCGGAAGCCG GCTTCGGCGG CGTGCTGAAC GCCTTCGAAC TGATGAAGAA CATGATCGCC 
GCGGGCGCCG CCGGCGTGCA CTTCGAGGAC CAGCTCGCCG CAGTGAAGAA GTGCGGCCAC 
ATGGGTGGCA AGGTGCTGGT GCCGACCCAG GAAGCCTGCG AGAAGCTGAT CGCCGCGCGC 
TTCGCCGCCG ACGTGATGGG CGTGTCGACC ATCGTGCTGG CCCGGACCGA TGCCGAGGCC 
GCCAACCTGA TCACCAGCGA CCACGACGCC AACGACAAGC CATTCCTGAC CGGCGAACGC 
ACCCAGGAAG GCTTCTACCG CGTGAAGAAC GGCCTGGAGC AGGCCATCAG CCGCGGTGTT 
GCCTACGCCG CCTACGCTGA CCTCGTGTGG TGCGAGACCG GCACGCCGGA CCTGGGATTC 
GCCCGTGAGT TCGCGCAGGC CGTGCATGCC AAGCACCCGG GCAAGCTGCT GAGCTACAAC 
TGCTCGCCGT CGTTCAACTG GAAGAAGAAC CTGGACGACA AGACGATCGC CGTGTTCCAG 
GAGAAGCTCT CGGAGCTGGG CTACAAGTAC CAGTTCATCA CCCTCGCAGG CATCCACATC 
AACTGGTACA ACACCTTCCA GTTCGCCCAG GCCTATGCGA AGGGCGAGGG CATGAAGCAC 
TACGTCGAGA TGGTGCAGGA GCCCGAGTTC AAGGCGCGCG AGCAGGGCTA CACCTTCGTG 
TCGCACCAGC AGGAAGTCGG CGCCGGCTAC TTCGACGACG TCACCACGGT GATTCAGGGC 
GGCTCGTCCA GCGTCAAGGC GCTGACCGGC TCGACCGAGG AAGAGCAGTT CCACTGA

Protein sequence

MSQPTREQQI AALEKDWAEN PRWKGLKRGY SAADVVRLRG SLQPEYTIAK RGAEKLWAQC 
NGASKKGYVN AFGAITAGQA MQQAKAGVEA VYLSGWQVAA DGNTSETMYP DQSLYAYDSV 
PTMVRRINNT FKRADEIQWS RGTGPGDKDF IDYFLPIVAD AEAGFGGVLN AFELMKNMIA 
AGAAGVHFED QLAAVKKCGH MGGKVLVPTQ EACEKLIAAR FAADVMGVST IVLARTDAEA 
ANLITSDHDA NDKPFLTGER TQEGFYRVKN GLEQAISRGV AYAAYADLVW CETGTPDLGF 
AREFAQAVHA KHPGKLLSYN CSPSFNWKKN LDDKTIAVFQ EKLSELGYKY QFITLAGIHI 
NWYNTFQFAQ AYAKGEGMKH YVEMVQEPEF KAREQGYTFV SHQQEVGAGY FDDVTTVIQG 
GSSSVKALTG STEEEQFH