Gene Mpe_A3279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3279
Symbol
ID	4786498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3487777
End bp	3488754
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	72%
IMG OID	640091852
Product	AraC family transcriptional regulator
Protein accession	YP_001022467
Protein GI	124268463
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.853616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCACG ACCGTGCGTT CTCCACCCTC CACCTGCCGC CGGGCCAGCG CGTCGCGCGC 
TGGACGGAGG CCGCCTCGGA CCGCTTCGTC GAATCCCGCT TCAAGGTGCA GGACCCGGAC 
CGCTTCGTCG CCTCGATGCT GCACCGCGAC CTCGCCGAAC TGTCGGTGAC CCGCATCACC 
TCGGTCGGCC ACGGCTTCAA GCACATCACC CGCTCGCAGC GCCAGGTGGC CCGCGCGCAC 
GAGGACTTCT TCCTGGTCAG CGTGCAGCTC GAGGGTTCGT GCTGGATCGC GCAGGGCGGC 
CGCGAGACGC GGCTGGCGCC AGGGCAGTTC GCGATCTACG ACACCCGGCG CCCCTACGAA 
CTGCTGCTCG AAGAGGACTA CCAGCAGGCC GTGCTGCGCA TCCCCTGCGC CACGCTGATG 
GCGCGTGCGC CCGATTGCGA TGCGCAGACG GCACAGGCCA TCTCGGCGGC CAGCAGCTCC 
GCACGACGGC TGATCCACCA GGTCCGCGAA GCCTGTCGTG GCACGCGCCT GTCGCGTCCG 
GCGCTGGCCG AGGCCTTGCT GGGCGCCGTC GGCGGCGGCC TGCGCGGCGA CGCCGACAGC 
CGTGCAGCGA CGCCGCATTC GCGCCGCACG CTGCTGGCGC GCATCAAGGC CCATGTGGTC 
GCCCACCTGG GTGATCCGCA GCTGTCGGTG CCGGGCATCG CCGCGACGCT GGGGCTGTCG 
ACCAGCTACC TGCACCAGCT GTTCCGCTCC GAGGGCAGCA CGCTGGAACG CTGGATCTGG 
GCTCAGCGCC TGGCCGCCTG CGAACGCGCC CTGATCGACC CGCGCGCGGC GCGGCACACG 
CTGACGCAGA TCGCCTACAG CCATGGCTTC AGCGATGCGG CGCATTTCAG CCGCAGCTTC 
CAGCAGCGCT ACGGCGCCTC GCCGCGCGAG TACCGCAAGT CGGCCGCCAC GGTGCCCGCG 
GCCGGACCAC GCGACTGA

Protein sequence

MGHDRAFSTL HLPPGQRVAR WTEAASDRFV ESRFKVQDPD RFVASMLHRD LAELSVTRIT 
SVGHGFKHIT RSQRQVARAH EDFFLVSVQL EGSCWIAQGG RETRLAPGQF AIYDTRRPYE 
LLLEEDYQQA VLRIPCATLM ARAPDCDAQT AQAISAASSS ARRLIHQVRE ACRGTRLSRP 
ALAEALLGAV GGGLRGDADS RAATPHSRRT LLARIKAHVV AHLGDPQLSV PGIAATLGLS 
TSYLHQLFRS EGSTLERWIW AQRLAACERA LIDPRAARHT LTQIAYSHGF SDAAHFSRSF 
QQRYGASPRE YRKSAATVPA AGPRD