Gene Mpe_A2224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2224
Symbol
ID	4785356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2378512
End bp	2379639
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	72%
IMG OID	640090792
Product	molybdate metabolism transcriptional regulator
Protein accession	YP_001021415
Protein GI	124267411
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG1910] Periplasmic molybdate-binding protein/domain [COG2005] N-terminal domain of molybdenum-binding protein
TIGRFAM ID	[TIGR00637] ModE molybdate transport repressor domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATAGCA ACAACAACGA CGACTCGCCT GCGCCCACCC GTTCGCCGCA GCGCGTGCAG 
CTCACCTATT CGCTCGGGAC CGACGGCACC GCCGGGCCGG TGCATCACCC GCTGTTCGCG 
CTGCTCGACG CGCTGCACCG CGGCGGTTCG ATCTCGGCCG CGGCCACGGC GCTGGGGTTC 
TCCTACCGGC ATGTCTGGGG TGAACTGCGG CGCTGGGAGA CCGAACTGGG CCGCTCGCTG 
ATCATCTGGA ACAAGGGCCA GCGCGCGGTG CTCACGTCCT TCGGCGACAA GCTGCTGTGG 
GCCGAGCGTC GGGCGCAGGC GCGGCTCGCG CCGCAGATCG AGTCGCTGCG CATGGAGCTG 
GAGCGCGCCT TCGCGGATGC CTTCGACGAC CGCGTCGACG TGCTCAGCGT CTGCGCCAGC 
CATGACCAGG CGTTGCCGCT GCTGCGAGAA CTGGCGCTGG CGGAACAGCT GCACCTCGAC 
ATCGAGTTCG CCGGCAGCCT CGACGCGTTG CACACCCTCG ACGCCGGCGG CTGCCTGCTC 
GCCGGCTTCC ACGTGCTGGA CGGCGTGGCG CGCGGCTCGG TCAGTGCACG CACCTACCGC 
GCACGGCTGA AGCCGGGCCA CCACAAGCTG ATCGGCTTCG CGCAGCGCGT TCAGGGCGTG 
ATGACGGCGC CCGGCAACCC GCTGAAGGTG GGGTCGCTGC ACGACCTGTC GCGGCCCGGT 
CTGCGCTGGG TCGGGCGCCC CGAGGGCACC GGCACGCGGG TGCTGCTGGA GGAACTGATC 
GAACAGGCCG GCCTGAAGAT GCCGGAGGCC TTCGCGCTGA TCGAGCCGTC GCACGGCGCG 
GCCGCGCAGG CCGTGGCCAG CGGCGCGGCC GACGCGGCCT TCGGGCTGGA GGCCGCGGCG 
CGCGCCGCCG GACTGGGCTT CGTGCCGCTG GCCCGCGAGC GCTACTTCCT CGTGACGCTG 
AAGTCCACGC TGGAGCAGCC AGCGGTGCAG CGCCTGGTGA GCCTGCTGGG CTCCACGACC 
TGGGCCCGCA CGCTGGCCGG CCTGCCCGGC TACCGCGCCA CCGAGCCCGG CGCGGTGCTG 
GCATTGACGA AGGTACTGCC GTGGTGGAGC TACCGCAGCA AGCACTGA

Protein sequence

MHSNNNDDSP APTRSPQRVQ LTYSLGTDGT AGPVHHPLFA LLDALHRGGS ISAAATALGF 
SYRHVWGELR RWETELGRSL IIWNKGQRAV LTSFGDKLLW AERRAQARLA PQIESLRMEL 
ERAFADAFDD RVDVLSVCAS HDQALPLLRE LALAEQLHLD IEFAGSLDAL HTLDAGGCLL 
AGFHVLDGVA RGSVSARTYR ARLKPGHHKL IGFAQRVQGV MTAPGNPLKV GSLHDLSRPG 
LRWVGRPEGT GTRVLLEELI EQAGLKMPEA FALIEPSHGA AAQAVASGAA DAAFGLEAAA 
RAAGLGFVPL ARERYFLVTL KSTLEQPAVQ RLVSLLGSTT WARTLAGLPG YRATEPGAVL 
ALTKVLPWWS YRSKH