Gene Mpe_A2658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2658
Symbol
ID	4785883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2830286
End bp	2831392
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID	640091229
Product	AraC family transcriptional regulator
Protein accession	YP_001021847
Protein GI	124267843
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGGCGCG CGGCGCCGCG CTCCTATGAT GGTCCGCACC CACCCCGGCC GTCGGCGGTC 
GCGAGCAGGA GACCCGAAGT GGACAGGCAG ACCTCATCGC TGGTCGATTG CTGGGAGGAC 
CCCGCCGTCT GGTCGACCGA GCGCGTGGCC CCGAGCAAGC AGTTCGATTG CTGGCGCGAC 
TTCGTCATCG ACGCCCACCT GCACTGGTCG ATCCGGCCGA TCCGCTGCGA GCGCTTCCCG 
GCCTTCATCC GCCAGGGCCG CTTCGACGGC TTTCGCGTCA CCCACCTCAC CTCCGCCCAG 
GGCGGCATCG TCGGCACGCG CGGCGCGCGC GAGATGGCGC AGGACAGCGA GGCGCTCTAC 
AACCTGATCT ACATCGCCGA GGGGTCGATC TGCCTGGTCA TCGACGACGA GGAACTCACG 
CTGACCCCGG GTAGCTTCGC GCTCTGGGAC AGCGCGCGCC CGATGACCTT CATCACCGGC 
GCCGGCCTGC GGCAGATCAC CCTCGCGGTG CCGCAGCGCG AACTGCAGCT CGCGCTGCCG 
CGCGCCGGCG AGTTCGTCGG CCGCCGCTTC GCGGCCACCA GCGGCCTCAG CCGGCTGTTC 
GTCGACCACC TCATCTCGCT CGACGCGCGC TTCGGCGAGC TGCCGCGCGG CAACGCGGGC 
CACGTGCTGC ATGCCAGCGT GGAATTGCTG GCCTCCACGC TGAGCGCGCA GGCCGAGCCC 
TGCGCCGGAC GCAGCGGGAA GATCGTGTTG CAAGGGGTGA TGGCCTACAT CGACCGCCAC 
CTCGACGATC CGGAACTCGA CACACGCCGC GTCGCGAGCG ACTGCGGCAT CACCGAGCGG 
CATCTGCACC GGCTGTTCGA ACGCGCCGAC ACCACGGCGG CAGCCTGGAT ACGGCGACAG 
CGGCTGGACC GCTGCCGCCA GGACCTGCGC GCAGCCGAGA CCGCGCACCT CAGCATCACG 
CAGATCGCCT ACCGCTGGGG TTTCGGCGAC TCCAGCAGCT TCAGCAAGAT CTTCAAGCGC 
GAGTTCGCCA GCAGCCCGAA GGACTACCGC GCCGCCGGCG GCTTCTCCAG CCAGGCCCGG 
CGTGCCTCCA GCGGCTGGGC CACGTAG

Protein sequence

MRRAAPRSYD GPHPPRPSAV ASRRPEVDRQ TSSLVDCWED PAVWSTERVA PSKQFDCWRD 
FVIDAHLHWS IRPIRCERFP AFIRQGRFDG FRVTHLTSAQ GGIVGTRGAR EMAQDSEALY 
NLIYIAEGSI CLVIDDEELT LTPGSFALWD SARPMTFITG AGLRQITLAV PQRELQLALP 
RAGEFVGRRF AATSGLSRLF VDHLISLDAR FGELPRGNAG HVLHASVELL ASTLSAQAEP 
CAGRSGKIVL QGVMAYIDRH LDDPELDTRR VASDCGITER HLHRLFERAD TTAAAWIRRQ 
RLDRCRQDLR AAETAHLSIT QIAYRWGFGD SSSFSKIFKR EFASSPKDYR AAGGFSSQAR 
RASSGWAT