Gene Mpe_A1500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1500
Symbol
ID	4784098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	1615958
End bp	1616917
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	67%
IMG OID	640090067
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_001020697
Protein GI	124266693
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.635643
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.380438
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCGT CTCTCGACAT GAACCAGTTG TTGCCCGAAA TCGACCATCG TCATCTCGAC 
GCGCTCGAAG AGGAAGCCAT CTTCATCCTG CGCGAGGTGG CCGGCGCCTT CGAGCGCCCG 
GCCCTGCTGT TCTCGAGCGG CAAGGACTCC TGCGTCGTGC TGCGCCTGGC CGAGAAGGCC 
TTCAAGATGC GCAGGCAGGG TAATGAGTTC GAGGGCCGCC TGCCCTTCCC GCTGCTGCAC 
GTCGACACCG GGCACAACTT CCCCGAAGTC ATCGAATTCC GCGACCGCCG CATCGCCGAG 
ATGGGCGAGC GCCTGGTCGT CGGCCACCTC GAGGACTCCA TCCAGCGCGG CACGATCCGG 
CTGTCGCACC CGCTGGAGTC GCGCAACGGC CACCAGACCG TGACGCTGCT CGAGGCGATC 
GAGGAGCACC GCTTCGACTG CCTGATCGGC GGCGCCCGCC GCGACGAGGA GAAGGCGCGC 
GCCAAGGAAC GCATCTTCAG CCACCGCGAC AGCTTCGGCC AATGGCAGCC GAAGGAGCAG 
CGTCCGGAGC TCTGGAGCCT GTTCAACACG CGCATCAAGC CCGGCGAGCA TTTCCGCGCC 
TTCCCGATCA GCAACTGGAC CGAACTCGAC GTGTGGCTCT ACATCGCCCG CGAGAACATC 
CCGCTGCCGA ACCTGTACTT CGCACACCAG CGTCAGGTGA TCCGCCGCAA GGGGCTGCTG 
GTTCCACTGA CCGACGTGAC GCCGCCCGAG GCCGGCGAGA CCGTGGAGGA AGCGCTGGTG 
CGCTTCCGCA CCGTCGGCGA CATGACCTGC ACCTGCCCGG TCGAGAGCCC GGCCGCGAAC 
GCCGCCGAGA TCGTGGCCGA AACGCTGACG GTCACCATCA GCGAGCGCGG CGCGACCCGC 
ATGGACGACC GCACCTCGGA CGCTTCGATG GAGCGGCGCA AGAAGGAAGG CTATTTCTGA

Protein sequence

MNASLDMNQL LPEIDHRHLD ALEEEAIFIL REVAGAFERP ALLFSSGKDS CVVLRLAEKA 
FKMRRQGNEF EGRLPFPLLH VDTGHNFPEV IEFRDRRIAE MGERLVVGHL EDSIQRGTIR 
LSHPLESRNG HQTVTLLEAI EEHRFDCLIG GARRDEEKAR AKERIFSHRD SFGQWQPKEQ 
RPELWSLFNT RIKPGEHFRA FPISNWTELD VWLYIARENI PLPNLYFAHQ RQVIRRKGLL 
VPLTDVTPPE AGETVEEALV RFRTVGDMTC TCPVESPAAN AAEIVAETLT VTISERGATR 
MDDRTSDASM ERRKKEGYF