Gene SAG0698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0698
Symbol
ID	1013502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	689050
End bp	690849
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	35%
IMG OID	637315886
Product	beta-D-glucuronidase
Protein accession	NP_687713
Protein GI	22536862
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3250] Beta-galactosidase/beta-glucuronidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATATC CATTATTGAC AAAAACAAGA AATACTTATG ATTTAGGCGG TATTTGGAAC 
TTTAAATTAG GAGAACATAA TCCAAATGAA TTACTACCTT CAGATGAAGT CATGGTTATC 
CCGACTTCAT TTAATGATTT GATGGTAAGT AAAGAAAAAC GTGATTATAT AGGTGATTTT 
TGGTATGAAA AAGTCATTGA AGTACCTAAA GTATCAGAGG ATGAAGAGAT GGTGCTGCGT 
TTTGGCTCAG TGACACATCA AGCTAAAATT TATGTTGACG GTGTATTGGT AGGAGAGCAT 
AAGGGAGGTT TTACTCCTTT TGAAGTTCTT GTTCCTGAAT GTAAGTATAA TAATGAGAAA 
ATTAAGGTAT CAATTTGTGC TAATAACGTT TTAGACTATA CCACGCTTCC GGTCGGAAAT 
TATAGTGAAA TCATTCAAGA AGATGGTAGC ATTAAGAAGA AAGTACGTGA GAATTTTGAT 
TTCTTCAATT ATGCAGGTGT GCATCGTCCT CTTAAGTTGA TGATACGTCC TAAAAATCAT 
ATTTTTGATA TTACAATTAC AAGTCGTCTA TCAGATGATT TACAGTCAGC AGATTTACAT 
TTTTTAGTGG AGACTAATCA AAAGGTTGAC GAAGTTAGAA TTAGCGTTTT TGATGAAGAT 
AACAAACTAG TGGGTGAAAC GAAGGATAGC AGATTATTTC TTAGTGATGT CCATCTTTGG 
GAAGTTTTAA ATGCCTATCT GTACACAGCG CGTGTTGAAA TTTTTGTTGA TAATCAACTC 
CAAGATGTCT ATGAGGAAAA TTTTGGTCTT AGAGAAATAG AAGTGACAAA TGGTCAATTC 
CTATTGAATC GCAAACCTAT TTATTTTAAA GGATTTGGTA AACATGAAGA TACGTTCATT 
AATGGCAGAG GTTTGAATGA AGCTGCTAAC TTAATGGATT TGAATCTTTT GAAGGATATG 
GGGGCAAACT CTTTTAGAAC ATCCCATTAT CCTTATTCTG AAGAAATGAT GCGTTTAGCA 
GATCGAATGG GAGTGTTAGT GATAGATGAG GTTCCAGCAG TAGGGTTATT TCAAAATTTT 
AACGCTTCCT TAGATTTGTC ACCAAAAGAT AATGGTACGT GGAATTTGAT GCAAACAAAA 
GCGGCGCATG AACAAGCTAT CCAAGAATTA GTGAAGCGTG ATAAAAATCA TCCTAGCGTC 
GTGATGTGGG TAGTCGCTAA CGAACCGGCT AGTCATGAAG CGGGAGCACA TGATTATTTT 
GAGCCATTAG TAAAACTTTA TAAAGATTTA GACCCTCAAA AACGTCCTGT CACCTTGGTT 
AATATTTTAA TGGCAACCCC AGATAGAGAC CAAGTGATGG ACCTGGTTGA TGTTGTCTGC 
CTTAATCGTT ACTATGGTTG GTACGTTGAC CACGGTGATT TAACAAATGC AGAAGTAGGT 
ATAAGAAAAG AGTTATTAGA ATGGCAAGAT AAATTTCCTG ACAAACCAAT TATCATAACG 
GAGTATGGCG CTGATACGTT ACCGGGATTA CATTCTACTT GGAATATTCC ATATACAGAA 
GAATTTCAAT GTGATTTTTA TGAAATGAGT CATCGTGTTT TTGATGGTAT TCCTAATTTA 
GTTGGTGAGC AAGTCTGGAA TTTTGCAGAC TTTGAAACTA ATCTGATGAT ACTTCGTGTA 
CAGGGGAATC ACAAAGGTCT CTTTTCAAGG AATCGCCAGC CGAAACAAGT CGTCAAAGAA 
TTTAAAAAAC GCTGGATGAC TATTCCTCAT TACCATAATA AAAAAAATAG TGTAAAATAG

Protein sequence

MLYPLLTKTR NTYDLGGIWN FKLGEHNPNE LLPSDEVMVI PTSFNDLMVS KEKRDYIGDF 
WYEKVIEVPK VSEDEEMVLR FGSVTHQAKI YVDGVLVGEH KGGFTPFEVL VPECKYNNEK 
IKVSICANNV LDYTTLPVGN YSEIIQEDGS IKKKVRENFD FFNYAGVHRP LKLMIRPKNH 
IFDITITSRL SDDLQSADLH FLVETNQKVD EVRISVFDED NKLVGETKDS RLFLSDVHLW 
EVLNAYLYTA RVEIFVDNQL QDVYEENFGL REIEVTNGQF LLNRKPIYFK GFGKHEDTFI 
NGRGLNEAAN LMDLNLLKDM GANSFRTSHY PYSEEMMRLA DRMGVLVIDE VPAVGLFQNF 
NASLDLSPKD NGTWNLMQTK AAHEQAIQEL VKRDKNHPSV VMWVVANEPA SHEAGAHDYF 
EPLVKLYKDL DPQKRPVTLV NILMATPDRD QVMDLVDVVC LNRYYGWYVD HGDLTNAEVG 
IRKELLEWQD KFPDKPIIIT EYGADTLPGL HSTWNIPYTE EFQCDFYEMS HRVFDGIPNL 
VGEQVWNFAD FETNLMILRV QGNHKGLFSR NRQPKQVVKE FKKRWMTIPH YHNKKNSVK