Gene SAG2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG2049
Symbol	metE
ID	1014860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	2022942
End bp	2025179
Gene Length	2238 bp
Protein Length	745 aa
Translation table	11
GC content	37%
IMG OID	637317215
Product	5-methyltetrahydropteroyltriglutamate-- homocysteine S-methyltransferase
Protein accession	NP_689035
Protein GI	22538184
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0620] Methionine synthase II (cobalamin-independent)
TIGRFAM ID	[TIGR01371] 5-methyltetrahydropteroyltriglutamate--homocysteine S-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAAG TTTCAAATTT AGGGTATCCA CGTCTTGGTG AACAGCGCGA ATGGAAGCAA 
GCGATCGAAG CTTTCTGGGC AGGGAATCTT GAACAAAAAG ATTTAGAAAA ACAACTAAAA 
CAATTACGTA TCAATCATTT AAAGAAACAA AAAGAGGCAG GTATTGACCT TATTCCAGTG 
GGGGATTTTT CTTGTTATGA TCATGTTTTG GATTTGTCAT TTCAATTCAA TGTAATCCCA 
AAGCGTTTCG ATGAGTATGA GAGGAATTTA GACCTTTATT TTGCTATTGC AAGAGGTGAT 
AAAGATAATG TCGCATCATC TATGAAAAAG TGGTTTAATA CCAACTACCA CTACATAGTC 
CCAGAATGGG AGGTTGAGAC TAAACCTCAC TTGCAGAATA ATTACTTACT TGATCTTTAT 
CTAGAAGCTA GGGAAGTAGT TGGTGATAAA GCAAAGCCGG TTATCACTGG TCCAATAACC 
TATGTTTCCT TATCATCAGG AATTGTCGAC TTTGAAGCGA CTGTTCAGCG GTTATTACCA 
CTTTATAAGC AGGTCTTTCA AGATCTGATA GATGCAGGCG CCACCTATAT TCAGATTGAT 
GAGCCGATAT TTGTAACTGA TGAAGGTGAA CTTTTAGTAG ATATAGCTAA GTCTGTTTAT 
GATTTTTTTG CAAGAGAAGT ACCACAAGCC CACTTCATCT TTCAAACCTA CTTTGAATCA 
GCAGTCTGTT TAGATAAACT CTCTAAGCTG CCAGTAACGG GATTTGGCCT TGATTTTATA 
CATGGTAGGG CGGAAAATTT AGCTGCTGTT AAGCAAGGTC TATTCCGCGA AAAAGAATTA 
TTTGCAGGAA TTGTTAATGG TCGAAATATC TGGGCAGTAA ATTTAGAAGA AACGTTGGCT 
TTATTGGAAG AGATAGGTCC CTTTGTTAAA CGATTGACTC TTCAACCTTC TTCAAGTCTT 
TTACATGTAC CGGTGACGAC TAAATACGAA ACACATTTAG ACCCTGTGTT AAAGAATGGC 
TTATCATTTG CTGATGAAAA ACTAAAGGAA TTAGAACTAT TAGCTAGTGC TTTTGATGGT 
AATAAAACAA AGGGATATCA CGAAGCTTTA TCTCGTTTTT CAGCTCTTCA AGCTGCTGAT 
TTTCGTCATG TAGCATTGGA ATCATTAGCA GAAGTAAAGC TTGAACGAAG TCCGTATAAA 
TTACGCCAAG CTTTGCAAGC TGAAAAATTA CAGTTACCGA TTTTACCAAC AACAACTATT 
GGATCCTTTC CTCAATCACC TGAAATTAGG AAGAAACGCC TTGCTTGGAA AAGAGGAAAT 
CTATCTGACT CAGATTATAA AGATTTCATA AAAACTGAAA TTAGAAGATG GATTGCTATT 
CAAGAAGATC TTGATCTTGA TGTGTTAGTA CATGGCGAAT TTGAGCGTGT TGATATGGTT 
GAATTTTTTG GTCAAAAGTT AGCTGGTTTT ACGACAACCA AATTAGGCTG GGTACAGTCT 
TATGGTTCAA GGGCGGTCAA ACCACCTATC ATTTATGGTG ATGTCAAACA TATTCAACCC 
TTAAGCCTTG AAGAAACGGT TTATGCCCAA AGTTTGACTA AGAAACCTGT TAAAGGCATG 
TTGACAGGTC CTATTACTAT AACGAACTGG TCATTTGAGC GAGATGATAT TAGCCGATCT 
GATCTTTTTA ATCAAATTGC TTTGGCTATA AAAGATGAGA TTCAACTTTT GGAACAATCA 
GGTATTGCTA TTATACAAGT GGATGAAGCA GCCCTTCGAG AAGGTTTACC CTTACGCCAG 
CAAAAGCAAC AGGCTTACTT AGATGATGCT GTTGCGGCCT TTAAAATTGC AACTTCATCT 
GTGAAAGATG AGACACAAAT TCATACACAT ATGTGTTATT CAAAATTTGA CGAAATTATT 
GATTCTATCC GTGCACTAGA TGCAGATGTT ATTTCTATTG AAACGAGTAG AAGTCATGGG 
GACATCATTG AAAGTTTTGA AACAGCAGTT TATCCTCTAG GAATTGGCCT GGGTGTTTAT 
GATATTCATT CCCCTCGCAT ACCTACTAAG GAAGAAATTA TTGTCAATAT TCAACGATCA 
CTAAAATGTC TATCAAAAGA GCAATTTTGG GTAAACCCTG ATTGTGGCTT AAAAACACGC 
CGTGAAGCAG AAACAATTGC TGCCTTGGAG GTTCTTGTTT CAGCTACCAA AGAGGTTCGT 
CAGCAATTAG ATAATTAA

Protein sequence

MVKVSNLGYP RLGEQREWKQ AIEAFWAGNL EQKDLEKQLK QLRINHLKKQ KEAGIDLIPV 
GDFSCYDHVL DLSFQFNVIP KRFDEYERNL DLYFAIARGD KDNVASSMKK WFNTNYHYIV 
PEWEVETKPH LQNNYLLDLY LEAREVVGDK AKPVITGPIT YVSLSSGIVD FEATVQRLLP 
LYKQVFQDLI DAGATYIQID EPIFVTDEGE LLVDIAKSVY DFFAREVPQA HFIFQTYFES 
AVCLDKLSKL PVTGFGLDFI HGRAENLAAV KQGLFREKEL FAGIVNGRNI WAVNLEETLA 
LLEEIGPFVK RLTLQPSSSL LHVPVTTKYE THLDPVLKNG LSFADEKLKE LELLASAFDG 
NKTKGYHEAL SRFSALQAAD FRHVALESLA EVKLERSPYK LRQALQAEKL QLPILPTTTI 
GSFPQSPEIR KKRLAWKRGN LSDSDYKDFI KTEIRRWIAI QEDLDLDVLV HGEFERVDMV 
EFFGQKLAGF TTTKLGWVQS YGSRAVKPPI IYGDVKHIQP LSLEETVYAQ SLTKKPVKGM 
LTGPITITNW SFERDDISRS DLFNQIALAI KDEIQLLEQS GIAIIQVDEA ALREGLPLRQ 
QKQQAYLDDA VAAFKIATSS VKDETQIHTH MCYSKFDEII DSIRALDADV ISIETSRSHG 
DIIESFETAV YPLGIGLGVY DIHSPRIPTK EEIIVNIQRS LKCLSKEQFW VNPDCGLKTR 
REAETIAALE VLVSATKEVR QQLDN