Gene Mpe_A1964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1964
Symbol
ID	4784750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2102353
End bp	2104314
Gene Length	1962 bp
Protein Length	653 aa
Translation table	11
GC content	72%
IMG OID	640090534
Product	hypothetical protein
Protein accession	YP_001021157
Protein GI	124267153
COG category	[S] Function unknown
COG ID	[COG4121] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03197] tRNA U-34 5-methylaminomethyl-2-thiouridine biosynthesis protein MnmC, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.117707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGG CGCCGATCAC GCCAGGCCGC CTGGCCTTCT CACCCGACGG CGTGCCGCTG 
GCGCCGGAGT TCGGCGATGT CTACCACCCG GCGGCGGGCG CGCTGCAGCA GGCGCACCAC 
GTCTTCCTCG GCGGTAACCG GCTGCCGGCG CGCTGGGGCG GTCGCGGGCG CTTCGTGATC 
CTCGAGACCG GCTTCGGCCT GGGCAACAAC TTCCTCGCCA CCTGGGACGC CTGGCAACGT 
GACCCGCAGC GCTGCGAGCG GCTGGTGTTC GTCTCGATCG AGAAGCATCC GCTGACGCGC 
GAGGACCTGG CTCGTGCGCA CGCGGCTTCA CCGCTGCCCG AATTGGCCCG TGCACTGGTT 
TCGGCCTGGC CCTTGTCGAC GCCGAATTTG CATCCGATCG CCTTCGAAGG CGGTCGCGTG 
CAACTGCTGC TGGGTTTCGG TGACGTGGCC TTGCTGCTGC CGCAATTGGT GGTGTCGGTC 
GACGCCTTCT TCCTCGACGG GTTCGCCCCG GCCCGCAATC CTGAGATGTG GGAGCCGCGC 
CGGCTTCAGC GCCTGGGCCG GCTCGCCGCG CCCGGCGCAA CCGCGGCGAC CTGGAGCGCT 
GCGCGGGTCG TGCGTGACGG GCTCTCGGCA GCCGGCTTCA CGGTGGAAAC CACAGCCGGT 
ACCGGCGGCA AGCGCGACAT CACGGTGGCG CGATTCACAC CAAGGCACAT CGCGGTGCCC 
CCGCCCGGTG GCTGGCATGC GCACGACGCG GCCTCACGCG AAGCCTTGGT GATCGGCGCC 
GGTCTGGCCG GCTGCGCGGC AGCCTGGGCG TTGTCGCAAC AGGGCTGGCA GTGCCAGCTG 
CTGGATCGTG CGGCGGAGCC GGCCGACGTC ACGTCTGGCA ATCCGGCCGG CCTGTTCCAC 
GGCAGCTTCC ACCGCGACGA CGGTCCGCAT GCCCGCACAC TGCGAGCCGC GGCACTGGCG 
ACCGAACGCC TGGCCGGCGC GTGGATCGCG CAGGGCCGAG TGTCCGGCCA GCTCGCTGGC 
TGCCTGCGCC TCGAATCGAG GTGGTCGGAC GACGCGGCGC GCGCGGCAAT GGCGGCCCAG 
CAGATCGCCC CCGGCTATAT CGACTGGATG GACCGGGCCG TCGCGAGCAC GCTCTCCGGC 
CTCGCCCTGC CGAGCGGCGC CTGGTTCTAC CCGGGCGGCG GCTGGCTCGC GCCGCGCGAC 
TATGCGCGCG AACTGCTTGC GCGCAGTGGC TCCCTCTTTC GGGGCGGCAT CGACGTGGCG 
ACCATCGAGC GGCATAGCGG CTTGTGGCGC GTGCTCGACG AACAGCGCCA GGTGATCGCC 
GAAGCACCGG TGCTGGTGCT GGCCAACGGG CTCGGTGCGA ACGGCCTGCT GGCCTCCGGC 
CGCGGTGAGG TGCCGTGGCC GCTGACGGCG GTGCGCGGAC AGATCAGCAG CCTGGCGACC 
GACGGTCACC CCGCCACCCT GCCCTGCCCG CGCCTGCCGG TCGCCGGCGG CGGCTATGTG 
CTGCCGCAGA CGGGCGGTCG GCTGCTCTTC GGCGCCACCA GCCAGCCCGA CGACATCGAT 
CCCGCGCTGC GCGATGCCGA CCACCGATTC AATCTGCAAC AGCTCGCAGG ACTGTCGGGC 
TGCGACGTCG AAGCCTGGTC CAGCCTGCCC TGGCAGGGCC GCGTGGGGTG GCGCGCAGTG 
ACGAGCGATC GGCTGCCGCT GATCGGTGCA GTGCCCGACC TGGAGGCGCT GGACCGCACT 
TCGCGCGCCG ACCAGCCGCG CTTCGTGCCG CGCCAGCGCG ACGCGCGAGG CGGTCTCTAT 
GTCTTCACCG GCCTCGGTTC GCGCGGCATC ACCTGGGCCG CGCTCGGTGG CCAGTTGCTG 
GCCTCGTGGA TCAGCGGCGC GCCCTGCCCG CTCGAAGCCG ATCTGCGCGA CGCGCTCGAC 
CCCGCGCGCT ACGCGCTGCC GCGCTGGCGC AGCGACTCGT AG

Protein sequence

MKTAPITPGR LAFSPDGVPL APEFGDVYHP AAGALQQAHH VFLGGNRLPA RWGGRGRFVI 
LETGFGLGNN FLATWDAWQR DPQRCERLVF VSIEKHPLTR EDLARAHAAS PLPELARALV 
SAWPLSTPNL HPIAFEGGRV QLLLGFGDVA LLLPQLVVSV DAFFLDGFAP ARNPEMWEPR 
RLQRLGRLAA PGATAATWSA ARVVRDGLSA AGFTVETTAG TGGKRDITVA RFTPRHIAVP 
PPGGWHAHDA ASREALVIGA GLAGCAAAWA LSQQGWQCQL LDRAAEPADV TSGNPAGLFH 
GSFHRDDGPH ARTLRAAALA TERLAGAWIA QGRVSGQLAG CLRLESRWSD DAARAAMAAQ 
QIAPGYIDWM DRAVASTLSG LALPSGAWFY PGGGWLAPRD YARELLARSG SLFRGGIDVA 
TIERHSGLWR VLDEQRQVIA EAPVLVLANG LGANGLLASG RGEVPWPLTA VRGQISSLAT 
DGHPATLPCP RLPVAGGGYV LPQTGGRLLF GATSQPDDID PALRDADHRF NLQQLAGLSG 
CDVEAWSSLP WQGRVGWRAV TSDRLPLIGA VPDLEALDRT SRADQPRFVP RQRDARGGLY 
VFTGLGSRGI TWAALGGQLL ASWISGAPCP LEADLRDALD PARYALPRWR SDS