Gene SAG1297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1297
Symbol
ID	1014104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1308706
End bp	1310061
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	44%
IMG OID	637316471
Product	C-5 cytosine-specific DNA methylase
Protein accession	NP_688295
Protein GI	22537444
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000219997
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTT TAGATTTATT TGCTGGGATA GGCGGTTTTA GGCTAGGGAT GGAATCACAG 
GGTCATAAAT GCCTGGGCTT TTGTGAAATT GATAAATTCG CTAGAACATC TTATAAAGCC 
ATGTTTAACA CAGAAGGGGA AATAGAATAC CATGACATTA AAGAGGTCAC AGACCATGAC 
TTTAGACAAT TTAGAGGGCA AGTGGACATC ATCTGCGGGG GATTTCCTTG CCAAGCATTT 
TCACTCGCAG GCAGACGATT GGGATTTGAA GATACTCGAG GGACTCTCTT TTTTGAGATT 
GCTCGAGCGG CCAAACAAAT CCAACCACGT TTTCTATTTT TGGAAAACGT CAAAGGCCTA 
CTCAATCACG ACGAGGGACG GACGTTCGCC ACAATCCTCT CCACGCTGGA TGAATTGGGG 
TATGATGTCG AATGGCAGGT GCTTAACAGC AAGGACTTCC AAGTCCCGCA AAACAGAGAA 
CGGGTCTTTA TTATCGGACA TTCTAGAAGA TACCGTTCCA GATTCATATT TCCTCTCAGA 
AGAGAAGACA GCCCAGCTCA TCTTGAAAGG CTAGGAAATA TCAATCCCTC TAAACATGGT 
TTGAATGGTG AAGTCTATCT GACGAGTGGA CTTGCTCCTA CACTAACAAG AGGTAAAGGA 
GAGGGTGCAA AAATCGCCAT TCCAGTCTTA ACACCAGATA GACTAGAAAA ACGCCAACAT 
GGTCGTCGAT TTAAGGACAA TCAAGACCCT ATGTTTACTT TGACCAGTCA AGACAAACAC 
GGAGTTGTTG TCGCAGGAAA TCTGCCGACT AGCTTTGACC AGACCGGTAG AGTATTTGAC 
ATTTCTGGCT TGTCACCGAC CTTGACCACC ATGCAAGGTG GAGACAAGGT GCCAAAGATT 
TTGCTGAGGG AGGAGCTGCC ATTTCTGAAA ATCAAGGAAG CCACTAAAAC AGGGTACGCA 
AAGGCAACTC TTGGAGACTC TGTCAATCTG GCTTATCCAG ACTCAACCAA ACGTAGGGGA 
CGTGTGGGAA AGGGAATATC CAATACTCTG ACGACTTCAG ACAATATGGG AGTAGTAGTT 
GCTGCTCTGG AATATCGACA GGATAAGTGG TATGAAGTCA CAGGCATTGT CTTAGAGGGG 
AAACTTTATC GCCTGAGAAT AAGACGACTG ACACCAAGAG AGTGCTTCAG ACTTCAAGGC 
TTTCCTGATT GGGCTTATGA AAGAGCAGAG AGTGTTTCTA GTAAGAGCCA ACTATACAAA 
CAGGCCGGCA ATAGCGTGAC TGTCACAGTT ATTGAAGCCA TTGCCAGAGA ATTTAGAAGA 
ACGGAAGAGG AAGAAAAACA TGAACTTACT ACATAA

Protein sequence

MKFLDLFAGI GGFRLGMESQ GHKCLGFCEI DKFARTSYKA MFNTEGEIEY HDIKEVTDHD 
FRQFRGQVDI ICGGFPCQAF SLAGRRLGFE DTRGTLFFEI ARAAKQIQPR FLFLENVKGL 
LNHDEGRTFA TILSTLDELG YDVEWQVLNS KDFQVPQNRE RVFIIGHSRR YRSRFIFPLR 
REDSPAHLER LGNINPSKHG LNGEVYLTSG LAPTLTRGKG EGAKIAIPVL TPDRLEKRQH 
GRRFKDNQDP MFTLTSQDKH GVVVAGNLPT SFDQTGRVFD ISGLSPTLTT MQGGDKVPKI 
LLREELPFLK IKEATKTGYA KATLGDSVNL AYPDSTKRRG RVGKGISNTL TTSDNMGVVV 
AALEYRQDKW YEVTGIVLEG KLYRLRIRRL TPRECFRLQG FPDWAYERAE SVSSKSQLYK 
QAGNSVTVTV IEAIAREFRR TEEEEKHELT T