Gene Mext_4604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4604
Symbol
ID	5832252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	5144326
End bp	5145618
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	69%
IMG OID	641370398
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001642043
Protein GI	163854000
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.105232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGCG AAACGATCGC CCTTCATGCC GGCTTCGACC ACGATCCGGC CACGCACGCG 
GTCGCTGTGC CGATCTATCA GAGCGTCGCC TACGCCTTCG ACAGCGCCGA CCACGGCGCC 
GCCCTTTTCA ACCTGGAGGA AGAGGGTTTT CGCTACAGCC GGATCGCTAA CCCGACGGTC 
GCCGTGCTGG AGCGGCGCGT GGCGGAACTG GAGGGCGGCC ATTCGGCGCT CGCCGTCGCG 
TCGGGGCAGG CCGCACTCCA CTACGCCATC GCCACCCTGG CGGATCATGG CGGCAACATC 
GTCGCGGTGC CCCAGCTCTA CGGCACGACG CATACGCTGC TGGCCCACGT CCTGCCGCGC 
CAGGGCATCA CCTGCCGCTT CGCCGCGAGC GATCGGGACG CGGATATCGC GGCGCTGATC 
GATGGCGACA CCCGCGCCGT CTACTGCGAA TCGATCGGCA ATCCGGCCGG CAACATCTGC 
GATATCGAGG CCCTGGCGGC CGTGGCCCAC GCCCACGGCG TACCGCTCGT GGTCGACAAC 
ACCGTGCCGA CCCCGATTCT GATGCGGCCG ATCGATTACG GGGCCGACAT CGTCATCGCC 
TCGCTCACCA AGTTCATGGG CGGCCACGGC ACCACGCTCG GCGGCATCAT CGTCGATTCC 
GGCCGCTTCG ACTGGACGGC GCAGGCTGAG CGCTTCCCGA TGTTCACGCG GCCGGACGTC 
TCCTATCACG GCCTCGTCTA CGCCGACCAT TTCGGCCGCG GTGCCTTCGC CGCGCGGGCG 
CGCAGCGTCT ACCAGCGCAC CACCGGCGCC GTGCTGCCGG CGATGTCGGC CTTCCTGCTG 
CTGCAAGGCA TCGAGACGGT GGCGCTGCGG GTCGAGCGCC ATGTCGCGAA CGCGCGCAAG 
GTCGCCGAGC ACCTGCGGGC GCATCCGCAG ATCGCCTGGG TGAACTATGC CGGGTTCGCC 
GACAGCCCGA ACCACCCGAT GGCGCGCAAG TACCTGAAGG GCGAAGGCTC TTCGCTCCTG 
ACCTTCGGCG TTGTGGGCGG GTTCGCGGGC GGCAAGACGT TCTACGACGC GCTGAAGCTG 
GTGAAGCGCC TCGTCAACAT CGGCGATGCC AAGTCGCTCG CCTGCCATCC GGCCTCGACG 
ACGCACCGGC AGATGACCCC CGACGAGCAG CGGGTCGCGG GCGTGCTGCC GGAGACGATC 
CGGCTCAGCG TCGGCATCGA GCATATCGAC GACATCCTCG AAGACCTCGA CCAGGCGCTC 
GCCGCCGTGG CCCCCGCCGC ACTCGCGGCC TGA

Protein sequence

MRSETIALHA GFDHDPATHA VAVPIYQSVA YAFDSADHGA ALFNLEEEGF RYSRIANPTV 
AVLERRVAEL EGGHSALAVA SGQAALHYAI ATLADHGGNI VAVPQLYGTT HTLLAHVLPR 
QGITCRFAAS DRDADIAALI DGDTRAVYCE SIGNPAGNIC DIEALAAVAH AHGVPLVVDN 
TVPTPILMRP IDYGADIVIA SLTKFMGGHG TTLGGIIVDS GRFDWTAQAE RFPMFTRPDV 
SYHGLVYADH FGRGAFAARA RSVYQRTTGA VLPAMSAFLL LQGIETVALR VERHVANARK 
VAEHLRAHPQ IAWVNYAGFA DSPNHPMARK YLKGEGSSLL TFGVVGGFAG GKTFYDALKL 
VKRLVNIGDA KSLACHPAST THRQMTPDEQ RVAGVLPETI RLSVGIEHID DILEDLDQAL 
AAVAPAALAA