Gene Mext_1995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1995
Symbol
ID	5831556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2224832
End bp	2225998
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	641367796
Product	regulatory protein LuxR
Protein accession	YP_001639465
Protein GI	163851422
COG category	[K] Transcription
COG ID	[COG2771] DNA-binding HTH domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCC ATTCCCACCC CTTTCCCTCC GCCATTCGCT CGGCCTCGAT CGAGCCGGCC 
GCCGCCCTGT CGGCCGAGGG CGCCGCCCTG ATCGACCGGA TCTACGAGGC GGCGGCCTTG 
CCCGAGCTGT GGCGCGATGT GCTCGTCGAA CTCGCCCGCT TCGCCGGCGC CCCGCAGGCG 
GTGATGATCG TCTCGACCGG GACGCACTTT CGCGACTTCG TGACGACGTC GCCGGAGTTC 
GACCCGTTGG TGATCGATCA TTTCGAGCGC TTCCCCGACA ACGTCCGCAT CGGACGCCTG 
TTGGCGCTGC GTCATCCCGG CTTTCTCAAC GACCTCGACG TCGTGACGGA GGAGGAGATC 
GCGACGCTGC CGCTCTATCA GGACTTCCTG ATCCCCCGGG GCTACGGCGC GGGTACCGCG 
ACGGCCGTGC TGGTGCCGAG CGGCGACAGC GTCATCGTCC ATTGCGAGCG CGCCCGCGCC 
GAGGGCGATT TCGGACCGCA GATTCTGTCC GCACTCAACA GCCTGCGTCC CCATCTCGCG 
CGGGCCGCCC TGCTTTCCGC ACGCCTGGAG ATGGAGCGGG TCTCGACCAC CACCCGGACG 
CTCGAAGCGC TCGGCCTGCC GGCGGCCGTG CTCGGAAGCG GCGGGCGGGT CATCGACGCC 
AATCCGTCCC TGGTGGCGAT GATGCCTCAC ACCCTCAGCG ACCAGCCCTT GCGGCTCGCC 
GTCGTCGATC CGGCCGCCGA CAGGCTGCTG CGCGAAGCCG TGGCACAATC CGCCTCGACG 
CAGGCGATGC CGGTGCGCTC GATCCCGATC GCCGCGAGCG GTGAGCGTCC CCCGGTGATC 
CTGCATCTCG TGCCGATCCG CGGCGCGGCC CACGACGTGT TCGTCCGCGC CCGCTTCGTG 
CTGATCGCGA CCCCCGTCGT GGCCCAGGAC GTGCCGAGTG CGGATGTGGT CCAGGGCCTG 
TTCGACCTGA CGCCGGCCGA GGCCCGGCTC GCCGCCCTGA TCGCGGCGGG CGATGCCCCG 
GCACCGGCCG CGGCCAAGCT CGGGATCACC CCCAGCACCG CCCGCTCGGT GCTCCGGCGC 
ATCTTCCAGA AGACCGGCGT GTCGCGCCAA GCCGAGCTCG TCGGCCTGCT CGCCGGCCGG 
GGCGCCGGGT CGGGATTGCG CGAATAG

Protein sequence

MTIHSHPFPS AIRSASIEPA AALSAEGAAL IDRIYEAAAL PELWRDVLVE LARFAGAPQA 
VMIVSTGTHF RDFVTTSPEF DPLVIDHFER FPDNVRIGRL LALRHPGFLN DLDVVTEEEI 
ATLPLYQDFL IPRGYGAGTA TAVLVPSGDS VIVHCERARA EGDFGPQILS ALNSLRPHLA 
RAALLSARLE MERVSTTTRT LEALGLPAAV LGSGGRVIDA NPSLVAMMPH TLSDQPLRLA 
VVDPAADRLL REAVAQSAST QAMPVRSIPI AASGERPPVI LHLVPIRGAA HDVFVRARFV 
LIATPVVAQD VPSADVVQGL FDLTPAEARL AALIAAGDAP APAAAKLGIT PSTARSVLRR 
IFQKTGVSRQ AELVGLLAGR GAGSGLRE