Gene Mpe_A2336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2336
Symbol
ID	4783853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2506127
End bp	2507329
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	640090905
Product	hypothetical protein
Protein accession	YP_001021527
Protein GI	124267523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.342455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGG GCAGCGCACC ACGGCGCGAT GGCCCGGTTG CGCTGTCGGC GTTGTTCGAC 
GAGGCGCTGC GGCACCTTGA GCCGAAGGAA CCGGCGCAGG GCACGGCGCC GAGCCAGGAC 
TGCTTTCTCT ACAGCGGCAA CCGGCACGAG AGCGTCCCGC GCGCGCTGTT CCTCGACCGG 
CGCCTGACGC CGCTGGAGCG CAATGCCTGG CAGGTGTTCC GCCTGCAGCT CAACGACGAC 
GGCGTGACCG CCTTTCCTAC CTACGACCAG CTCCGCCCCT ATCTGGCGTC CATGCCCTGT 
GCGTCGCAAG CCTCGCACGA GACCGTGGCG CGCGCCTTGA CGCTGCTGCG GCTGACACGC 
TGGCTCAGCC TGGTGCGGCG GCGGCGCGAT CCCAGGACCG GCCGTATCCA AGGCAACCTC 
TACGTGCTGC ACGACGAACC GCTGTCGCCC TTCGAGGCGA TGCAGCTCGA TGCCGACTAC 
CTCGGCCTGG TCAGTCAGGC GCTGACCCAT GCCGCCAAGG CGGTACAGAT GGTGGGCATG 
AACACGCTCA AGGAGATTGC CGAAGACCCG CTGCTCAGCG GCCGCACGCT GCCGACCCGC 
CTGCAGGTGC TCGCGCAGCG CATGGCGCGG CATGGCTGGA CGACGCCAGG TTATCCACAG 
GAGGGTGCCG GCCACGAATC CGAAGAGGGC CAGGAAGCCC TTCTTCGGAA TGCTGCGCGC 
CCGTCTTCGG AATCCGAAGC AGGGCCGAAA CCCGCGCCGG ACGGCTCTCT TCGGATTCCG 
AAGGAGGACC GTACAGTACG TAATGATCGT ATAAATGAAG TACGTACAGT ACCGCGCGCG 
AGGGCCTTGC AGAACCTGCG ACTGCCCGAG CGTTTCCTGC GCTTGAAGGA TGAGCAGCAG 
GCAGGCGCGT TGGTGGCCCT GCAGCAGGTG GACGAAGCGC AGCGGCAGGC CGTGCTCGAC 
GAGTGGGCGG CACGCTGTGG CGGCAGTACG GTGCGCAATC CCGCCGGCTA CTTGTTCGGC 
ATCATCCAGA AGGCGATCCG CGGGGAGTTC AAGGCGTGGG CGGGCAACGA CGCAGCAGCG 
CCGCCCGCGC CGCGAGCTGC GGGGCCGGCG CCATCGTCGT CGCCTTCGGC TTCCCGCCCA 
GCCGACCCCG AGGTGGCGCG CGCCTACCTC GCACGGCTGC GTTCAGCCTT GCGCGATCCC 
TGA

Protein sequence

MTTGSAPRRD GPVALSALFD EALRHLEPKE PAQGTAPSQD CFLYSGNRHE SVPRALFLDR 
RLTPLERNAW QVFRLQLNDD GVTAFPTYDQ LRPYLASMPC ASQASHETVA RALTLLRLTR 
WLSLVRRRRD PRTGRIQGNL YVLHDEPLSP FEAMQLDADY LGLVSQALTH AAKAVQMVGM 
NTLKEIAEDP LLSGRTLPTR LQVLAQRMAR HGWTTPGYPQ EGAGHESEEG QEALLRNAAR 
PSSESEAGPK PAPDGSLRIP KEDRTVRNDR INEVRTVPRA RALQNLRLPE RFLRLKDEQQ 
AGALVALQQV DEAQRQAVLD EWAARCGGST VRNPAGYLFG IIQKAIRGEF KAWAGNDAAA 
PPAPRAAGPA PSSSPSASRP ADPEVARAYL ARLRSALRDP