Gene SAG1719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1719
Symbol
ID	1014528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1712437
End bp	1714776
Gene Length	2340 bp
Protein Length	779 aa
Translation table	11
GC content	37%
IMG OID	637316887
Product	MutS2 family protein
Protein accession	NP_688709
Protein GI	22537858
COG category	[L] Replication, recombination and repair
COG ID	[COG1193] Mismatch repair ATPase (MutS family)
TIGRFAM ID	[TIGR01069] MutS2 family protein [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACA AGATTTTAGA ACAGTTAGAA TTTAACAAAG TTAAGGAATT GATATTACCT 
TATCTCAAGA CAGAACAATC ACAAGAAGAA TTATCAGAGC TGGAGCCGAT GACGGAGGCT 
CCTAAAATAG AAAAAAGTTT TAATGAAATT TCTGACATGG AACAGATTTT TGTTGAACAT 
CACTCATTTG GCATAGTCAG CCTAAGTTCA ATCTCTGAGA GTTTAAAACG CTTAGAGCTT 
TCAGCTGATC TTAATATTCA AGAACTTTTG GCTATCAAAA AAGTTTTACA GAGTTCTTCG 
GATATGATTC ACTTTTATTC TGATTTGGAT AATGTTTCTT TCCAATCTTT GGATCGTTTG 
TTTGAAAATT TGGAACAATT CCCTAATCTG CAAGGGTCTT TTCAAGCTAT CAATGATGGT 
GGTTTTTTAG AACATTTTGC GAGTCCAGAA TTAGAGCGTA TCCGTCGTCA ATTAACAAAC 
AGTGAACGAC GGGTTCGTCA GATTTTACAG GATATGCTTA AGGAAAAAGC AGAGCTTTTA 
TCAGAGAATC TAATCGCTAG TCGTAGTGGA CGAAGTGTCC TACCAGTAAA AAATACTTAT 
CGGAATCGTA TTTCTGGTGT GGTTCATGAC ATCTCTTCTT CAGGAAGTAC TGTTTATATT 
GAGCCTCGTG CTGTAGTTAC ACTAAACGAA GAGATAACGC AGCTTAGAGC TGACGAACGT 
CATGAAGAAA GTCGTATTTT ACACGCATTT TCAGACTTGT TAAGACCCCA TGTCGCCACT 
ATTAGAAATA ATGCATGGAT TCTTGGGCAT CTTGATTTTG TAAGGGCTAA ATATCTTTTT 
ATGTCTGATA ATAAGGCGAC GATACCTGAG ATTTCTAATG ACAGCACGTT AGCATTAATC 
AATGTTCGTC ATCCTCTGTT AAGTAACCCT GTGGCTAATG ACTTACATTT TGATCAAGAT 
TTAACTGCAA TTGTCATCAC TGGTCCCAAT ACTGGTGGTA AGACGATTAT GCTAAAAACA 
CTCGGTTTAG CACAATTAAT GGGACAGTCT GGTTTGCCAG TATTAGCGGA TAAAGGTAGT 
AAAATTGCAG TATTTAACAA TATCTTTGCA GATATTGGCG ATGAGCAATC TATTGAACAA 
AGTCTATCAA CTTTTTCTAG TCATATGACG CACATAGTCA GTATTTTAAA CGAGGCTGAC 
CACAATAGTT TAGTCCTCTT TGATGAACTG GGAGCAGGAA CGGATCCTCA AGAAGGTGCT 
AGTTTGGCTA TGGCTATTTT AGAACACCTT AGGTTAAGTA ATATCAAAAC GATGGCGACC 
ACGCACTATC CAGAATTAAA AGCTTATGGG ATTGAGACAA ATTTTGTAGA GAATGCGAGC 
ATGGAATTTG ATGCCGAAAC GCTTAGCCCT ACGTATCGCT TTATGCAAGG AGTTCCTGGA 
CGATCAAATG CATTTGAAAT TGCTTCTCGC CTTGGTTTAG CTCCATTTAT TGTTAAACAA 
GCTAAGCAGA TGACAGATTC TGACTCAGAT GTTAACCGTA TTATTGAACA GTTAGAGGCA 
CAGACACTTG AGACACGTAG AAGACTGGAT CATATTAAAG AAGTTGAACA AGAAAACCTC 
AAATTCAATC GTGCGGTTAA GAAACTCTAT AATGAATTTT CACATGAGCG CGATAAAGAG 
TTAGAAAAAA TCTATCAAGA AGCTCAAGAA ATTGTAGATA TGGCTTTGAA TGAGAGTGAT 
ACTATCTTAA AAAAACTCAA TGATAAGAGC CAATTAAAAC CTCACGAAAT TATAGATGCT 
AAGGCACAAA TAAAAAAATT AGCACCTCAA GTTGATTTAT CAAAAAATAA AGTCTTAAAT 
AAGGCTAAAA AAATTAAAGC AGCTCGTGCT CCTAGAATTG GTGATGATAT TATAGTGACT 
AGCTATGGAC AGCGAGGTAC CTTAACTAGT CAATTAAAAG ATGGACGTTG GGAAGCACAA 
GTGGGAATTA TCAAAATGAC ATTAACACAA GATGAATTTA CCCTTGTTAG AGTCCAAGAA 
GAACAGAAAG TCAAAAGTAA ACAGATTAAT GTGGTTAAAA AGGCTGATAG TTCTGGACCA 
AGAGCTCGAC TTGATCTTAG AGGTAAAAGA TACGAAGAAG CTATGCAAGA GTTAGATAAT 
TTTATTGATC AAGCATTGCT TAACAATATG GGACAAGTTG ATATCATTCA TGGTATTGGT 
ACAGGCGTTA TCCGTGAGGG AGTGACAAAA TATCTTCGTC GTAATAAGCA CGTTAAGCAT 
TTTGCTTATG CCCCACAAAA TGCAGGGGGA TCTGGCGCCA CAATTGTAAC GTTAGGGTAA

Protein sequence

MNNKILEQLE FNKVKELILP YLKTEQSQEE LSELEPMTEA PKIEKSFNEI SDMEQIFVEH 
HSFGIVSLSS ISESLKRLEL SADLNIQELL AIKKVLQSSS DMIHFYSDLD NVSFQSLDRL 
FENLEQFPNL QGSFQAINDG GFLEHFASPE LERIRRQLTN SERRVRQILQ DMLKEKAELL 
SENLIASRSG RSVLPVKNTY RNRISGVVHD ISSSGSTVYI EPRAVVTLNE EITQLRADER 
HEESRILHAF SDLLRPHVAT IRNNAWILGH LDFVRAKYLF MSDNKATIPE ISNDSTLALI 
NVRHPLLSNP VANDLHFDQD LTAIVITGPN TGGKTIMLKT LGLAQLMGQS GLPVLADKGS 
KIAVFNNIFA DIGDEQSIEQ SLSTFSSHMT HIVSILNEAD HNSLVLFDEL GAGTDPQEGA 
SLAMAILEHL RLSNIKTMAT THYPELKAYG IETNFVENAS MEFDAETLSP TYRFMQGVPG 
RSNAFEIASR LGLAPFIVKQ AKQMTDSDSD VNRIIEQLEA QTLETRRRLD HIKEVEQENL 
KFNRAVKKLY NEFSHERDKE LEKIYQEAQE IVDMALNESD TILKKLNDKS QLKPHEIIDA 
KAQIKKLAPQ VDLSKNKVLN KAKKIKAARA PRIGDDIIVT SYGQRGTLTS QLKDGRWEAQ 
VGIIKMTLTQ DEFTLVRVQE EQKVKSKQIN VVKKADSSGP RARLDLRGKR YEEAMQELDN 
FIDQALLNNM GQVDIIHGIG TGVIREGVTK YLRRNKHVKH FAYAPQNAGG SGATIVTLG