Gene Mext_2233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2233
Symbol
ID	5831927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	2480695
End bp	2481624
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	67%
IMG OID	641368032
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_001639699
Protein GI	163851656
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.230531
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCTG CCGTCGCCGC GCCCGCGCGC ACCCGCCTGA CGCATCTCCA GCGTCTCGAG 
GCCGAGAGCA TCCACATCTT CCGGGAGGCC GTCGCCGAGG CCGAGAACCC GGTGATGCTC 
TACTCGATCG GCAAGGATTC GTCGGTGCTG CTGCACCTGG CGCTGAAGGC CTTCGCGCCG 
GGGCGCCTCC CGTTCCCCCT GATGCACATC GACACGACCT GGAAGTTCCG CGAGATGATC 
GCCTTCCGCG ATCGGCGAGC CAAGGAGCTC GGGCTCGAAC TCATCGTGCA CACGAATCAG 
GACGGGCTTG CCAAGGGCGT CGGCCCGGTC AGCCACGGCT CGGAAGTGCA TACCGACGTG 
ATGAAGACGC AGGCCCTGCG GCAGGCGCTC GACAAGTACA AGTATGACGT GGCCTTCGGC 
GGCGCCCGCC GGGACGAGGA GGCCAGCCGC GCCAAGGAGC GCATCGTGAG CCTGCGCAAC 
GGCCAGCACC GCTGGGACCC GAAGCGCCAG CGCGCCGAGC CGTGGCACCT CTACAATTTC 
AAGAAGCGGC GCGGCGAGAG TTTTCGCGTG TTCCCGCTAT CCAACTGGAC CGAATTGGAT 
ATCTGGCTCT ACATCGAGCA GGAAAATATT CCGATCGTCC CGCTCTACTT CGCCGCCGAG 
CGCCCGGTGG TGGAGCGCGA CGGCCAGCTC ATCATGGTCG ATGACGAGCG CTTTCCGCTG 
GAGCCGGGCG AGACCCCACA ACAGCGGCAG GTCCGGTTCC GCACGCTCGG CTGCTACCCG 
CTGACCGGCG CGGTCGAGAG CCCGGCCGCG ACCCTGCCGG AGATCATCGG CGAGACGCTG 
GCCGCCCGAA CCTCGGAGCG CCAGGGCCGG GTCATCGACA AGGACGGCGC CGGCGCCATG 
GAGCGCAAGA AGCAGGAGGG CTATTTCTGA

Protein sequence

MSAAVAAPAR TRLTHLQRLE AESIHIFREA VAEAENPVML YSIGKDSSVL LHLALKAFAP 
GRLPFPLMHI DTTWKFREMI AFRDRRAKEL GLELIVHTNQ DGLAKGVGPV SHGSEVHTDV 
MKTQALRQAL DKYKYDVAFG GARRDEEASR AKERIVSLRN GQHRWDPKRQ RAEPWHLYNF 
KKRRGESFRV FPLSNWTELD IWLYIEQENI PIVPLYFAAE RPVVERDGQL IMVDDERFPL 
EPGETPQQRQ VRFRTLGCYP LTGAVESPAA TLPEIIGETL AARTSERQGR VIDKDGAGAM 
ERKKQEGYF