Gene SAG0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0043
Symbol	purD
ID	1012793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	57991
End bp	59256
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	50%
IMG OID	637315198
Product	phosphoribosylamine--glycine ligase
Protein accession	NP_687079
Protein GI	22536228
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTGC TTGTTGTTGG TTCTGGTGGT CGTGAGCATG CGATTGCTAA GAAGTTGTTA 
GCGTCTAAGG ATGTGGATCA GGTTTTTGTG GCACCTGGTA ATGATGGTAT GACCTTGGAT 
GGTCTAGACT TGGTAAATAT CGGAATTTCC GAACATTCTA GACTGATTGA CTTTGTTAAG 
GAGAATGAGA TTGCTTGGAC CCTTATTGGT CCTGATGATG CGCTAGCAGC TGGTATCGTT 
GATGGTTTTA ATAGTGCTGG ACTCAGAGCA TTTGGTCCAA CCAAGGCAGC CGCGGAGCTA 
GAGTGGTCAA AAGACTTTGC CAAGGAAATC ATGGTCAAAT ACAATGTTCC AACAGCAGCC 
TATGGCACAT TTTCAGATTT TGAAAAAGCT AAAGCCTACA TCGAAGAGCA GGGCGCACCA 
ATCGTGGTCA AGGCTGACGG ATTGGCGTTA GGCAAGGGCG TGGTCGTGGC TGAAACCGTT 
GAGCAGGCGG TAGAGGCGGC GCAAGAGATG CTTTTGGACA ACAAGTTTGG CGACTCGGGT 
GCGCGCGTGG TTATCGAGGA ATTCTTGGAT GGTGAAGAGT TCTCCCTTTT CGCCTTCGCT 
AATGGCGATA AGTTCTACAT CATGCCGACA GCTCAGGATC ACAAGCGTGC CTATGATGGT 
GACAAGGGGC TAAATACCGG TGGTATGGGT GCCTATGCGC CAGTTCCCCA CCTGCCTCAG 
AGCGTGGTGG ATACAGCAGT TGAGACTATC GTTAAGCCTG TCCTTGAAGG CATGATTGCC 
GAAGGGCGTC CTTATCTAGG TGTCCTCTAT GCTGGGCTTA TCCTGACGGC TGATGGCCCT 
AAGGTTATCG AGTTCAACTC ACGTTTTGGT GACCCTGAAA CTCAGATTAT CCTCCCTCGC 
CTGACTTCCG ATTTCGCTCA GAACATCGAC GACATCATGA TGGGCATCGA GCCTTACATC 
ACTTGGCAGA AGGACGGCGT GACTCTGGGC GTTGTCGTTG CCTCAGAAGG CTATCCGCTC 
GATTACGAGA AAGGTGTGCC ACTGCCTGAA AAGACCGACG GCGACATCAT CACCTACTAT 
GCGGGAGCTA AGTTTGCGGA AAATAGCAAA GCACTGCTCT CAAACGGAGG ACGTGTCTAC 
ATGCTTGTCA CCACAGAAGA CAGCGTCAAA GCAGGGCAGG ACAAAATCTA TACCCAACTC 
GCCCAACAAG ACACAACAGG CCTCTTCTAC CGAAACGACA TCGGAAGCAA AGCTATTAAG 
GAATAA

Protein sequence

MKLLVVGSGG REHAIAKKLL ASKDVDQVFV APGNDGMTLD GLDLVNIGIS EHSRLIDFVK 
ENEIAWTLIG PDDALAAGIV DGFNSAGLRA FGPTKAAAEL EWSKDFAKEI MVKYNVPTAA 
YGTFSDFEKA KAYIEEQGAP IVVKADGLAL GKGVVVAETV EQAVEAAQEM LLDNKFGDSG 
ARVVIEEFLD GEEFSLFAFA NGDKFYIMPT AQDHKRAYDG DKGLNTGGMG AYAPVPHLPQ 
SVVDTAVETI VKPVLEGMIA EGRPYLGVLY AGLILTADGP KVIEFNSRFG DPETQIILPR 
LTSDFAQNID DIMMGIEPYI TWQKDGVTLG VVVASEGYPL DYEKGVPLPE KTDGDIITYY 
AGAKFAENSK ALLSNGGRVY MLVTTEDSVK AGQDKIYTQL AQQDTTGLFY RNDIGSKAIK 
E