Gene SAG1855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1855
Symbol
ID	1014665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1849791
End bp	1851503
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	42%
IMG OID	637317024
Product	prophage LambdaSa2, terminase large subunit, putative
Protein accession	NP_688845
Protein GI	22537994
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.526141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGAGA TGAGATATTT TGATAAGTAT GCTCAGCTCA TCTATACTGG TAAGATTCGT 
ATTTGTAAGC TCACAATGAA ATCAATTAGA CGTGTTGAGC GATACAAAGA GCAATACCTC 
TTCAAACAGG AGGAAGCTGA CAAACGGATT GAGTTCATTG AGGAAGAGTG CAGCAATACT 
AAAGGCCTTG CTGGTAAGTT ACGCTTAGCA TTACCACAAA AGGTTTGGTT AGAAACAACG 
TGGGGCTTTT ATCACACGGT TGAGGTTACT AAGACCAATC CTGATACCTT GGAAGAATAC 
ACAGATTATG AAGAAAGGCG TCTCATTCAT GAGGTGCCTA TTATTGTGCC TCGTGGCACA 
GGTAAGACTA CTCTTGGTTC TGCTATTGCT GAGGTTGGTC AAATCATTGA CGGTGAGTGG 
GGTGCTGATA TTCAGCTTCT TGCTTACAGT CGTGAACAGG CTGGCTATTT GTTCAATGCC 
TCAAGGGCGA TGTTGTCGAA TGAAGAAAGC TTGCTGCACT ATATGCGTGA GGCTGACATC 
CTACGGTCAA CCAAGCAAGG TATCTTGTAT GAAACAACTA ACAGTCTTAT GTCTATCAAG 
ACTTCTGACT ATGAAAGCCT TGACGGTACT AATGCTCACT ACAATATCTT TGATGAGGTG 
CACACTTATG ATGATGACTT CATCAAGGTT GTGAATGATG GTTCCAGCCG TAAGCGTAAG 
AATTGGATAA CCTGGTACAT TTCCACAAAT GGAACGAAGC GTGACAAGCT CTTTGATAAG 
TATTACAACA TCTGGGTAGA TATCCTTGAT GACAAGATTA TCAATGATTC TGTCATGCCT 
TGGATTTATC AGTTGGACGA TGTGTCAGAG ATTCATGACC CTGATATGTG GCAGAAAGCT 
ATGCCATTAC TTGGTATCAC GACAGAGAAA GAAACCATCG CTCGTGATAT TGAGATGAGC 
AAGAATGATC CAGCACAACA AGCTGAGCTG ATGGCTAAGA CTTTCAATCT TCCTGTCAAC 
AACTATCTTG CTTACTTCAG CAATGAAGAG TGTAAAGGTT GGTCAGATAA GTTTGATGAG 
AGTTTGTTTG TCGGAGATGA TGAACGGAAC GCCCGTTGTG TGATTGGGAT TGACTTGTCA 
GATGTCAATG ACATCTGCTC TATCTCTTTT ATGGTTGTGC GTGGGGAAGA ACGGCACTAT 
CTAAACAAGA AATTCATGCC ACGGCATACC ATTGAGACAT TGCCAAAGGA ACTGCGTGAT 
AAGTACACTG AGTGGGAATT AAGTGGCATG CTGCATGTGC ATGAATTGGA CTACAATGAC 
CAAGCCTATA TATTTGAAGA GTTACGGCAG TTTATGAGTG ACAACAGAAT TTTGCCTGTG 
GCAGTCGGTT ATGACCGCTA CAATGCAAGG GAACTTATTC GCTTGTTTAA CGACTACTAC 
GGGGATATTT GTCACGATAT TCCCCAGACG GTCAAATCGT TATCAAATCC GCTCAAGGTT 
TACAAGGAGA AGGCTAAGAT GGGCAAAATC ATCTTTGATG ATCCTGTGGC GACATGGAAT 
CATGCCAACG TCCGTGTCAA AATTGATGCC AATAACAATA TTTTTCCAAA CAAGGAAAAG 
GCAAAAGAAA AGATTGATGT CTTTGCTAGT CAGCTAGATG CCTTTATCTG TTATGAAAAT 
TTCAAGGAAG ACTTGAGCTA CTACTTTGAT TGA

Protein sequence

MVEMRYFDKY AQLIYTGKIR ICKLTMKSIR RVERYKEQYL FKQEEADKRI EFIEEECSNT 
KGLAGKLRLA LPQKVWLETT WGFYHTVEVT KTNPDTLEEY TDYEERRLIH EVPIIVPRGT 
GKTTLGSAIA EVGQIIDGEW GADIQLLAYS REQAGYLFNA SRAMLSNEES LLHYMREADI 
LRSTKQGILY ETTNSLMSIK TSDYESLDGT NAHYNIFDEV HTYDDDFIKV VNDGSSRKRK 
NWITWYISTN GTKRDKLFDK YYNIWVDILD DKIINDSVMP WIYQLDDVSE IHDPDMWQKA 
MPLLGITTEK ETIARDIEMS KNDPAQQAEL MAKTFNLPVN NYLAYFSNEE CKGWSDKFDE 
SLFVGDDERN ARCVIGIDLS DVNDICSISF MVVRGEERHY LNKKFMPRHT IETLPKELRD 
KYTEWELSGM LHVHELDYND QAYIFEELRQ FMSDNRILPV AVGYDRYNAR ELIRLFNDYY 
GDICHDIPQT VKSLSNPLKV YKEKAKMGKI IFDDPVATWN HANVRVKIDA NNNIFPNKEK 
AKEKIDVFAS QLDAFICYEN FKEDLSYYFD