Gene Mpe_A2651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2651
Symbol
ID	4785876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2823631
End bp	2824587
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	72%
IMG OID	640091222
Product	AraC family transcriptional regulator
Protein accession	YP_001021840
Protein GI	124267836
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0391115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGATC ACCAATCGGC CGATGTCGAC GACCAGGCGC AGGCGCTGAG CGGTTGGCAG 
CAGCGCTACG AGCAACTCGG CTGCGGCCGC TTCCGGGGGT CGGCGCGGCA GGTGGTGATG 
GCCGGCGGCA CGGTGCTGCG CGAGTCCACC AACCGCCAGC TGCGCGAGCA GATCCGTCCG 
CCCTCCGACT GCCTGGTGCT GGCCATCCCG CTGTCGGTCG CGCCCGGTTC GGTGTTTGCC 
GGCCGGCCGC TGGACGGCGA TGCATTGATG GTCATCTCGG GCCACGAGGA GTACGAGCTG 
GTGGCGGCCG GCGAACTCGA CCTGCTGGCG CTGTCGGTCG ACCGACGGCG GCTGGGCGGC 
ATGCTGGCGC CCGAGGAGAT CGAGTGGCTG GCGCGGGCCG AACGCCAGCG GCGCTGGGCG 
CTGGCCCCCG ACACCGCCGG CGCGGTGCGC AGCCAGCTGC TCGCCGTGTG TTCAGCCGCT 
GGCCGCTGTG CGCCCGGTGC GGTGATCGAC ATCGAGAACG AGCCGGCGCT GATCGGCGCC 
ACGCTCGCGC ACACGGTGGC GCTGGCGATG TCGGACGGCG GCGCCGACCG CGGCGCGGTC 
GGCATTCCGC GGCGTGCCGA CTCGCGGCTG CGGGTGGTGA AGCGCGCCAT CGAATTCATC 
CGCGCCAACC TGCAGGAGGA CATCGGCATC CCCGAGATCT GCGCGGCCGC CTGCGCCAGC 
CGCCGCAGCC TGCAGTATTG CTTCGAGGAG TTCCTGCACA CCACGCCGCA GGCCTATCTG 
CGCGCGCTGC GCCTGAACGA GGCGCGGCGT CGCCTGAAGC AACCGGGCGA TCAGCCCATC 
ACGCTGCTGG CGTGCGCCAT GGGCTTCAGC AGCGCGAGCC ATTTCACTCG CCACTACAAG 
CTGATGTTCA ACGAGCTGCC GTCGCAGACG CAGCGGCGGC GCACGCGCGA CGCCTGA

Protein sequence

MLDHQSADVD DQAQALSGWQ QRYEQLGCGR FRGSARQVVM AGGTVLREST NRQLREQIRP 
PSDCLVLAIP LSVAPGSVFA GRPLDGDALM VISGHEEYEL VAAGELDLLA LSVDRRRLGG 
MLAPEEIEWL ARAERQRRWA LAPDTAGAVR SQLLAVCSAA GRCAPGAVID IENEPALIGA 
TLAHTVALAM SDGGADRGAV GIPRRADSRL RVVKRAIEFI RANLQEDIGI PEICAAACAS 
RRSLQYCFEE FLHTTPQAYL RALRLNEARR RLKQPGDQPI TLLACAMGFS SASHFTRHYK 
LMFNELPSQT QRRRTRDA