Gene Mext_0045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0045
Symbol
ID	5835745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	52134
End bp	53255
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	63%
IMG OID	641365829
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001637544
Protein GI	163849501
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGCCAAC GCCCGCCCGC GGTCGTTGGA GACATCGGAT CGCACGAGAG GCCATCTCTC 
ATTGGCTTGA CTCGCCCCGG AGTCGCGAAG GCGGTCTACC TCACTCTCGT CGAACTGGGC 
GCCAATTTGG ACGAACTGCT CGCCGAGGCG GGGCTTGATC CTCGGACCTT CGACGGCGGC 
AGGACCCCTG TCCCATACGC CTCGCTCGGT CGCCTGATCG CTCTGGGAGC CGAGAGGACG 
GGTTGTCACC ATCTCGGGCT CCTTGTTGGA CAGCGCGCGA CATTGGCCTC GCTCGGGCTG 
CTTGGCCTGC TCATGCGCCA CTCGGACACC ATCGGCGGCG CTTTGCGGGC TCTTGAAGCG 
CATGCCGGTG TGCGGAACTG GGGCGCAGTC GTCGGACTCG ATATCGACAG TGAGGTGGCC 
GTTCTCAGCT ACTGCCCTTA TGGCTCGGAA GCCGAGAGCA CGGCCCTCCA ATCAGAGAGG 
GCACTCGCCA CAATTACAAA CGTCATTCGG GCGTTGGGTG GCTCTGATGC GGCTCTATTA 
GAAGTGCTGT TGCCGCGCTC CGCGCCACGC GACACAGCGC CCTACATCAG CTTCTTTCGG 
GCGCCCGTGC GGTATGACCA AGAAACGGCC GCGTTGGTGT TTCCAACTCT ACTCCTTGAA 
CGGCGCATCA AGGGGGCGGA CCCGGCAGCC CGCGGGAGAG TTGAGGATCG CATCCGCAAG 
CTTGAGGCCG AACAGCCTTC CACGCTGAAG GACAAGCTTC GCGAGTACCT CCAAGCCCAG 
GTGATGCGGC AGCGCTGTAA GGCCGCGCAT GTGGCGCGAC TGCGACTGGT CCCCCCCCGT 
ACCCTGCGTC GTCGGCTGAA AGCCGAGGGC ACGACGTTCA AGCAAATCGC TAACGAAGCG 
CAGTTCTCAG TCGCCAAGCA GCTCCTAGCC AATACCAGAA TGAGCATGGC GCAGATCTCG 
GCGGCCTTGG ATTTCTCCGA GCCCGCTGCC TTTAGCCATG CGTTCCGACG CTGGTCAGGC 
TTCGCGCCCA GTACATGGCG GCGGGAGCAT CAGTCGAAGT GCCTTGGTCG AGAGCAGGAC 
GAAAATTCCT ACTCCGCACA GACACAGCAG CCGGTCCGAT AG

Protein sequence

MCQRPPAVVG DIGSHERPSL IGLTRPGVAK AVYLTLVELG ANLDELLAEA GLDPRTFDGG 
RTPVPYASLG RLIALGAERT GCHHLGLLVG QRATLASLGL LGLLMRHSDT IGGALRALEA 
HAGVRNWGAV VGLDIDSEVA VLSYCPYGSE AESTALQSER ALATITNVIR ALGGSDAALL 
EVLLPRSAPR DTAPYISFFR APVRYDQETA ALVFPTLLLE RRIKGADPAA RGRVEDRIRK 
LEAEQPSTLK DKLREYLQAQ VMRQRCKAAH VARLRLVPPR TLRRRLKAEG TTFKQIANEA 
QFSVAKQLLA NTRMSMAQIS AALDFSEPAA FSHAFRRWSG FAPSTWRREH QSKCLGREQD 
ENSYSAQTQQ PVR