Gene SAG0993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0993
Symbol
ID	1013797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1002308
End bp	1003618
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	37%
IMG OID	637316177
Product	NOL1/NOP2/sun family protein
Protein accession	NP_688004
Protein GI	22537153
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000219997
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAC CGAATGAATT TATTGAAAAA TATCAGACTA TACTTAAAGA TGAAGCAGAA 
GCTTTTTTTG ACAGTTTTGA ACAAAAACCC ATATCGGCAT ATCGCACCAA TCCTCTCAAA 
GAAAAGCAAC TTGATTTTCC AAATGCCATC CCAAGTACCC CTTGGGGGCA TTATGGGAAA 
ATATCAGGAA AATCAATAGA ACACACAACT GGCCTTGTTT ATTCTCAAGA ACCTGCTGCT 
CAGATAGTGG CTCAGATTGC TGAACCACAA GAAGGAATGA AAGTGCTAGA TTTAGCAGCT 
GCACCTGGTG GAAAAACAAC ACACCTTCTA TCATATTTAA ACAATACTGG TCTATTAGTT 
AGTAATGAAA TTTCAAATAA ACGTAGTAAA ATTTTAGTCG AAAATGTCGA ACGTTTTGGT 
GCTAGAAATG TTATCGTGAC TAATGAAAGC TCCCAACGAC TAGCCAAATG TTTTAATTCT 
TTTTTTGATC TTATTGTTTT TGACGGTCCG TGTTCTGGTG AGGGAATGTT CCGCAAAGAT 
CCTCAAGCAA TACAATATTG GCACAAAGAT TACCCCACTG AATGTGCACA GTTACAAAGA 
GATATTTTAA AAGAAGCAAT CAAAATGCTA GCTCATGGTG GTATACTTGT ATACTCTACT 
TGTACATGGT CACCAGAAGA GAACGAAGAA GTGGTTAATT GGCTCCTTCA AGAGTATGAT 
TACTTAGAAC TTGTTGATAT TCCTAAACTA AATGGGATGG TTGAAGGGAT TAATGTACCA 
CAAGTTGCAA GGATGTACCC TCATCATTTT CAAGGTGAAG GACAATTCGT TGCAAAACTG 
AGAGATACTA GATCTAAGGA AGCACAGAAA ATTAAGCCAA AAGCACAGAA AATAAATAAA 
ATGCAGTTAC AATTGTGGCA ACAATTTGCA CAAGACCATT TAAAGATAGA CTTGAACGGT 
GTTTTAGATG TTTTCGGCGA CCAACTCTAT CTTCTACCTA ATGGTCTCCC CGATTTGTCT 
AAATTAAAAA TAGCACGCAA TGGTCTCCAT CTAGGCACTT TCAAGAAGAA TCGTTTTGAG 
CCATCGTTTG CTTTAGGAAT GGCACTTAGC GAACATGACC TAGTACAGTC TATTGAAATT 
GATATAGAAC AGTTTGAGGT GTACGTATCT GGAAATGTAG TCAAACTAGA CAAGACTGTT 
CCAAACGGTT GGTATCAAAT TCTTGTAAAA GGCAATGGAT TAGGTTTTGC AAAAGTGACA 
AATAATACTC TTAAAAATTA TTACCCTAAA GGACTACGAT TTCAGACATA A

Protein sequence

MKLPNEFIEK YQTILKDEAE AFFDSFEQKP ISAYRTNPLK EKQLDFPNAI PSTPWGHYGK 
ISGKSIEHTT GLVYSQEPAA QIVAQIAEPQ EGMKVLDLAA APGGKTTHLL SYLNNTGLLV 
SNEISNKRSK ILVENVERFG ARNVIVTNES SQRLAKCFNS FFDLIVFDGP CSGEGMFRKD 
PQAIQYWHKD YPTECAQLQR DILKEAIKML AHGGILVYST CTWSPEENEE VVNWLLQEYD 
YLELVDIPKL NGMVEGINVP QVARMYPHHF QGEGQFVAKL RDTRSKEAQK IKPKAQKINK 
MQLQLWQQFA QDHLKIDLNG VLDVFGDQLY LLPNGLPDLS KLKIARNGLH LGTFKKNRFE 
PSFALGMALS EHDLVQSIEI DIEQFEVYVS GNVVKLDKTV PNGWYQILVK GNGLGFAKVT 
NNTLKNYYPK GLRFQT