Gene SAG1683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1683
Symbol
ID	1014492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1680408
End bp	1681946
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	39%
IMG OID	637316852
Product	immunogenic secreted protein, putative
Protein accession	NP_688674
Protein GI	22537823
COG category	[R] General function prediction only
COG ID	[COG3942] Surface antigen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00328189
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAC AAAAAGTAAT GGCAACTTTG TTGTTATCCA CTTTAGTCTT ATCGCTATCA 
TCACCTTTAG TGACCTTAGC AGAAACTATT AATCCAGAAA CAAGCCTGAC AATGGCAACA 
GCATCAACAG AAAGTTCTTC TGAAGCAGAG AAACAGGAAA AAACACAACC TACAGATTCA 
GAAACTGCTT CACCTTCAGC CGAAGGAAGT ATCTCAACAG AAAAAACAGA GATTGGTACG 
ACAGAGACAT CATCAAGCAA TGAATCATCA TCAAGTTCAT CACATCAATC TTCTTCCAAC 
GAAGATGCTA AAACATCTGA TTCTGCTTCA ACAGCATCTA CTCCTAGCAC TAATACTACA 
AACAGTAGTC AAGCAGACAG TAAGCCAGGT CAATCAACAA AGACTGAATT AAAACCTGAG 
CCTACCTTAC CATTAGTAGA GCCTAAAATA ACTCCCGCTC CGTCTCAGAT AGAAAGTGTT 
CAGACAAATC AGAATGCTTC TGTTCCTGCT TTATCCTTTG ATGATAACTT ATTATCAACA 
CCGATTTCAC CAGTGACAGC AACGCCATTC TACGTAGAAC ACTGGTCTGG TCAGGATGCC 
TACTCTCACT ATTTATTGTC ACATCGTTAC GGTATCAAAG CTGAACAATT AGATGGGTAC 
TTAAAATCTT TAGGGATTCA ATATGATTCT AATCGTATCA ATGGTGCTAA GTTATTACAA 
TGGGAAAAAG ATAGTGGTTT AGATGTCCGT GCTATTGTAG CTATTGCTGT CCTTGAAAGT 
TCATTGGGAA CTCAAGGAGT GGCTAAGATG CCAGGTGCTA ATATGTTTGG TTATGGTGCC 
TTTGATCATG ACTCTAGCCA TGCTAGTGCT TATAATGATG AAGAAGCAAT TATGTTGTTG 
ACAAAAAATA CAATTATTAA AAACAACAAC TCTAGCTTTG AAATCCAAGA TTTGAAAGCA 
CAGAAATTAT CTTCTGGACA ACTTAATACA GTTACTGAGG GTGGTGTTTA TTATACAGAT 
AACTCTGGAA CTGGTAAACG TCGTGCCCAG ATTATGGAAG ATTTAGACCG CTGGATTGAT 
CAACATGGAG GGACACCAGA AATTCCTGCT GCCTTGAAAG CTTTATCGAC AGCAAGTTTA 
GCAGATTTAC CAAGTGGTTT TAGCTTATCA ACAGCAGTTA ACACAGCTAG CTATATTGCA 
TCAACTTATC CATGGGGTGA ATGTACATGG TATGTCTTTA ACCGCGCTAA AGAGTTAGGT 
TATACATTTG ATCCATTTAT GGGTAATGGT GGAGATTGGC AACATAAGGC TGGTTTTGAA 
ACAACACATT CACCAAAAGT AGGCTATGCT GTATCATTTT CACCAGGACA AGCTGGTGCT 
GATGGCACTT ACGGTCACGT AGCTATTGTT GAAGAAGTTA AAAAAGATGG TTCAGTTCTT 
ATTTCAGAAT CTAATGCAAT GGGACGTGGT ATTGTCTCTT ACCGTACTTT TAGTTCAGCA 
CAAGCTGCAC AATTAACTTA TGTTATTGGC CATAAATAA

Protein sequence

MSKQKVMATL LLSTLVLSLS SPLVTLAETI NPETSLTMAT ASTESSSEAE KQEKTQPTDS 
ETASPSAEGS ISTEKTEIGT TETSSSNESS SSSSHQSSSN EDAKTSDSAS TASTPSTNTT 
NSSQADSKPG QSTKTELKPE PTLPLVEPKI TPAPSQIESV QTNQNASVPA LSFDDNLLST 
PISPVTATPF YVEHWSGQDA YSHYLLSHRY GIKAEQLDGY LKSLGIQYDS NRINGAKLLQ 
WEKDSGLDVR AIVAIAVLES SLGTQGVAKM PGANMFGYGA FDHDSSHASA YNDEEAIMLL 
TKNTIIKNNN SSFEIQDLKA QKLSSGQLNT VTEGGVYYTD NSGTGKRRAQ IMEDLDRWID 
QHGGTPEIPA ALKALSTASL ADLPSGFSLS TAVNTASYIA STYPWGECTW YVFNRAKELG 
YTFDPFMGNG GDWQHKAGFE TTHSPKVGYA VSFSPGQAGA DGTYGHVAIV EEVKKDGSVL 
ISESNAMGRG IVSYRTFSSA QAAQLTYVIG HK