Gene Mpe_A2841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2841
Symbol
ID	4785535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3020883
End bp	3021875
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	640091412
Product	inositol-1(or 4)-monophosphatase
Protein accession	YP_001022030
Protein GI	124268026
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0483] Archaeal fructose-1,6-bisphosphatase and related enzymes of inositol monophosphatase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.202978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAGA CCCTGCACCC CATGCTCAAC ACCGCCGTCA AGGCTGCACG CACCGCGGGG 
GCGCTGATCA ACCGGGCCTC GCTGGACATC GAGCGCGTGA CGGTGACGGC CAAGTCGCAC 
AACGACTTCG TGACCGAGGT GGACCAGGCG GCCGAGGCGG CGATCATCGA GACGCTGCTC 
GGCGCCTACC CCGGCCACGG CATCCTCGCC GAGGAGACCG GGCGGACCCA CGGCGCGAAG 
GACAGCGACT ACCTCTGGAT CATCGATCCG CTCGACGGCA CCACCAACTT CATTCACGGC 
TTCCCGGTCT ACGCGGTCTC GATCGCACTC GCCTTCCGCG GCCAGATCCA GCAGGCGGTG 
GTCTACGATC CCTCACGCAA CGACCTGTTC TACGCCTCCA AGGGACGCGG CGCCTTCCTC 
AACGACAAGC GCCTGCGCGT CAGCAAGCGC AGCCGCCTGC TGGAGTCGCT GATCGGCACC 
GGCTTCCCGT TCCGCAAGGG CGACAACTTC AAGCGTTACT TGAAGATGTT CGAGGAGGTC 
ATGCAGCACT GCGCCGGCCT GCGCCGCCCG GGTGCCGCCG CGCTGGACCT GTGCTACGTG 
GCCGCGGGCT GGTACGACGG CTTCTTCGAG ACCGGGCTGA ACCCCTGGGA CATCGCGGCC 
GGCTCGCTGA TCATCACCGA GGCCGGCGGC CTGATCGGCA ATTTCACCGG CGAGTCCGAC 
TTCCTCTACC AGCGCGAGAT CGTCGCGGGC AACCCGAAGA TCTATGCGCA GCTGGTGAGC 
ATCCTCGCGC CCTACACCCG CATCATCAAG GACGACGACG CGGGCGCCAC GGCCCCCGCT 
GCGGGCGCCG CAGCGGCGGC GCCGGACGCG ACCGCCGCCT TCGTCGCGAG CGTCGAGGCC 
GATACACCGC CCGCCGCCAC CGCGAAGAAG CCGCCGGTGC GCATCCGCAA GACCGACCTC 
GCCAAGGCCA AGGACAACGA CGCCCCGTTC TGA

Protein sequence

MSQTLHPMLN TAVKAARTAG ALINRASLDI ERVTVTAKSH NDFVTEVDQA AEAAIIETLL 
GAYPGHGILA EETGRTHGAK DSDYLWIIDP LDGTTNFIHG FPVYAVSIAL AFRGQIQQAV 
VYDPSRNDLF YASKGRGAFL NDKRLRVSKR SRLLESLIGT GFPFRKGDNF KRYLKMFEEV 
MQHCAGLRRP GAAALDLCYV AAGWYDGFFE TGLNPWDIAA GSLIITEAGG LIGNFTGESD 
FLYQREIVAG NPKIYAQLVS ILAPYTRIIK DDDAGATAPA AGAAAAAPDA TAAFVASVEA 
DTPPAATAKK PPVRIRKTDL AKAKDNDAPF