Gene Mpe_A1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1944
Symbol
ID	4786705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2080492
End bp	2081613
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	68%
IMG OID	640090514
Product	hypothetical protein
Protein accession	YP_001021137
Protein GI	124267133
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.085708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACGG TCCGCCGTCT CCTGTATGCC GACGTCCTGG GCGCGGTGAC CTTCGTCGCC 
GTGTCCTTCC TGTCGCTGTT CTTCTTCATC GACTTCGTGG AGGAGCTCGA CGACATCGGC 
CGTGGCGCCT ACCGCGTGCA CCATGCGGCC CTGTACTGCC TGCTGGAGCT GCCGGGGCGC 
CTGTACGAAC TGCTGCCGAT CGCGGTGTTG ATCGGCACCA TCTACGCGAT GGCCAGGCTG 
GCGCAGTCTT CAGAGTTCAC CATTCTGCGC ACCGGCGGGC TGGGTCCGGG CCGGGCCCTG 
TCGCTGCTCG CCAAGATCGG ACTGGCGTTC GCGGTGCTGA CCTTCGTGGT CGGCGACTAC 
GTCGGCCCCT ATTTCGATGC CAAGGCGCAG ACGCTCCGTT CCACGCTGCG CGGCTCGGCC 
TCCGGCGGCG GCAACAACAG CGCCTGGCTG AAGGACCGCC GCGCCGCCGC GCCGGGGGAG 
CTGCCCGCCG GAGAGCGCAT CGATTCGATC AACATCGGCA ACGTCGGGCC CGACGGTCTG 
CTCGACGACG TGCGCATCTA CGAGTTCAGC GAGGAAGGCC AGCTGCTGGC GCGTGTGGCC 
GCGGAGCATG CCGTGGTCGA AGACGGTGCC TGGCGCCTTA AAAAGGTGCG TCTCACGCGC 
TGGCATGCGG CGAGCGGCGA CGGCCTGCCG GTCGACGAGC GGCGCGACGA GCTGCGTTGG 
CCGACCCGCT TGACGCCTTC GGTGGTTGGT GCGGCCGTCT CGCCGCTCAA GAGCATGTCG 
ACCGTCGATC TCTACCGCTA CATGAGCCAT CTGTCCCAGA ACGAGCAGGC CGCGCAGCGC 
CAGGAGATCC AGTTCTGGAA GAAGGCGCTG TACCCGCTGG CCTGCCTGGT GATGGTGGGC 
CTGGCCCTGC CGTTCGCCTA CCTGCACGCG CGCGCCGGTG GCGTCAGCGT CAAGGTGTTC 
GGCGGCATCC TGCTGGGCAT CAGCTTCGTG CTGCTGAACA ACGTGTCGAC CCACCTCGGG 
TTGCTGCGCG ATTGGACGCC CTGGATCGCA GCCGCAGCAC CCGGCGCTTT CTACCTGCTG 
CTGTCGATGG CTGCCTTCAG CTGGCTCGTG CGCTACCGGT GA

Protein sequence

MRTVRRLLYA DVLGAVTFVA VSFLSLFFFI DFVEELDDIG RGAYRVHHAA LYCLLELPGR 
LYELLPIAVL IGTIYAMARL AQSSEFTILR TGGLGPGRAL SLLAKIGLAF AVLTFVVGDY 
VGPYFDAKAQ TLRSTLRGSA SGGGNNSAWL KDRRAAAPGE LPAGERIDSI NIGNVGPDGL 
LDDVRIYEFS EEGQLLARVA AEHAVVEDGA WRLKKVRLTR WHAASGDGLP VDERRDELRW 
PTRLTPSVVG AAVSPLKSMS TVDLYRYMSH LSQNEQAAQR QEIQFWKKAL YPLACLVMVG 
LALPFAYLHA RAGGVSVKVF GGILLGISFV LLNNVSTHLG LLRDWTPWIA AAAPGAFYLL 
LSMAAFSWLV RYR