Gene SAG0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0047
Symbol	purB
ID	1012797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	62573
End bp	63871
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	45%
IMG OID	637315202
Product	adenylosuccinate lyase
Protein accession	NP_687083
Protein GI	22536232
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.727181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGAAC GTTATTCACG CCCTGAGATG GCGGCAATTT GGACAGAGGA AAATAAATAC 
CGTGCTTGGT TGGAGGTCGA GATTTTGGCT GACGAGGCAT GGGCTGAGTT GGGTGAGATT 
CCTAAGGAGG ATGTGGCTAA GATTCGTGAG AAGGCGGATT TTGACATTGA CCGCATTCTT 
GAGATTGAGC AGGACACGCG TCACGATGTG GTGGCTTTCA CTCGTGCGGT TTCTGAGACG 
CTTGGTGAGG AGCGCAAGTG GGTGCACTAC GGTTTGACGT CGACTGACGT GGTGGACACT 
GCCTACGGTT ACCTCTACAA GCAGGCTAAC GATATTATCC GTCGTGACCT TGAGAATTTC 
ACAAATATTG TGGCTGATAA GGCTAAGGAG CACAAGTTCA CCATCATGAT GGGTCGTACC 
CACGGTGTTC ACGCTGAGCC AACGACTTTC GGTCTTAAGT TGGCGACCTG GTACAGCGAG 
ATGAAACGTA ATATTGAGCG TTTTGAACAT GCTGCCGCAG GTGTGGAAGC TGGTAAGATT 
TCAGGTGCCG TTGGTAACTT TGCTAACATT CCTCCATTTG TGGAACAATA TGTTTGTGAC 
AAATTGGGCA TCCGTCCGCA AGAGATTTCA ACACAGGTTC TTCCACGTGA CCTCCACGCA 
GAATATTTTG CAGTGCTTGC AAGCATTGCA ACTTCTATCG AACGTATGGC GACAGAGATT 
CGTGGTCTGC AAAAATCAGA ACAACGTGAA GTTGAAGAAT TCTTTGCCAA AGGTCAGAAA 
GGTAGCTCTG CTATGCCTCA CAAACGCAAC CCAATCGGTT CAGAGAACAT GACTGGGCTA 
GCGCGCGTGA TTCGTGGTCA CATGGTGACG GCTTATGAGA ACGTGGCACT TTGGCACGAG 
CGTGATATTT CGCACTCATC TGCTGAGCGT ATCATCACAC CTGACACAAC GATCTTGATT 
GACTACATGC TCAACCGTTT TGGCAATATC GTTAAGAACT TGACTGTCTT CCCGGAAAAT 
ATGATGCGCA ATATGGAATC AACTTTTGGT TTGATTTATA GTCAACGTGT TATGCTCAAA 
TTGATTGAAA AAGGAATGAC ACGAGAAGAA GCTTATGACT TAGTTCAACC TAAGACAGCT 
TATTCCTGGG ACAATCAAGT GGATTTCAAA CCACTTTTAG AAGAAGACAC CAAAGTTACC 
TCTTGTCTTA CACAGGAAGA AATTGATGAA CTATTTAATC CGATTTATTA CACAAAACGT 
GTTGATGATA TTTTTGAAAG ACTAGGATTA GAAAAATAA

Protein sequence

MIERYSRPEM AAIWTEENKY RAWLEVEILA DEAWAELGEI PKEDVAKIRE KADFDIDRIL 
EIEQDTRHDV VAFTRAVSET LGEERKWVHY GLTSTDVVDT AYGYLYKQAN DIIRRDLENF 
TNIVADKAKE HKFTIMMGRT HGVHAEPTTF GLKLATWYSE MKRNIERFEH AAAGVEAGKI 
SGAVGNFANI PPFVEQYVCD KLGIRPQEIS TQVLPRDLHA EYFAVLASIA TSIERMATEI 
RGLQKSEQRE VEEFFAKGQK GSSAMPHKRN PIGSENMTGL ARVIRGHMVT AYENVALWHE 
RDISHSSAER IITPDTTILI DYMLNRFGNI VKNLTVFPEN MMRNMESTFG LIYSQRVMLK 
LIEKGMTREE AYDLVQPKTA YSWDNQVDFK PLLEEDTKVT SCLTQEEIDE LFNPIYYTKR 
VDDIFERLGL EK