Gene SAG1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1048
Symbol
ID	1013852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1057597
End bp	1058829
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	36%
IMG OID	637316231
Product	hypothetical protein
Protein accession	NP_688058
Protein GI	22537207
COG category	[S] Function unknown
COG ID	[COG2966] Uncharacterized conserved protein [COG3610] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0526443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATG ATATGAGCGT TGTTCTTAGA GCAGGTAAAT TACTGATTGA AAGCGGAGCA 
GAAGTCTATC GTGTCGAAGA CACAATGAAG CATTTTGCTA AGGCTCTTCA GATAGAAAAT 
TTTGAAGCTT ATGTGGTTAG TAGCAGTATT ATCGCTTCCG GGATTAACCG CTATGGTAAA 
CAAGAAGCTA AAGTATGCAA TACAGATGGT GTAACAGCAA ATTTAGGTAG ACTTGAAGCT 
GTTAATAACC TTTCTAGGCA AATTGCTAAA CAAGACTTAG TATCTCCAGA AGAAATTGTA 
AAGCAGTTAG ACTTAATTGA ACATCAAAAA GATTATAGTT TACTTGTTAC TTTAATTTCT 
TATTTTTGTG GAGCGGGTAG TTTTTCTTTA GCCTTAGGTA GTTCCTTATT AGATTCATTT 
TCCGCTGCTG TAACAGGCTT AATTTTAGGA TATTTTCTGA ATTTGATGGA AAGTCGTATA 
CATACAGGAT TTCTTTTGAC CATTCTAGGT AGTTCTGTAG TGGCTTTAAG TGCTAATTTA 
TTATATTTTT CAGGATTAGG TGAGCATCGT AGCATTATTA TATTAGGGGC ACTAATGGTT 
ATGGTGCCAG GGGCTGCCTT TGTTAATTCG GTGAGAGAAT TTTCACAGAA TAATTTTTCA 
ACAGGTTTAG CTTTGATTAT GTCTGCTTTA CTCATTTGTA TTTCTATATC AGCAGGTGTG 
GCTATTACAA TTGAAATTAT TCCGTTTGCA GAACAAATGA CAGGTTCTTT TTCTGGTGTT 
CCTAATACCA TCCTTGAGAT TATCATCAGA ACACTAATGG CCGGTTTAGG GACGATAGCC 
TTCTCTATTC TCTACCATGT TCCAAAACGT TATTTCCTTG ACTTAGGTAT ACTAGGAGCA 
ATATCTTGGA TGCTCTACCT GATCTTATGG CAACAATTTC ACATGGATGC TATAGCCGTA 
TTTTTTCCAG GGCTTTTCAT CACTTATTTT TCACGGCTAT TAGCTGCTAA ACGTAAGTGT 
CCTGCCACTG TCTTTTTAGC GACAAGTATG TTTCCTCTTA TTCCAGGACT TAGCTTCTAT 
AGAGCTGTTT ACTTTTTATT GACGGGAGCA GATGCCGTAG CAATGGAATA TTTTAGATCC 
TGTTTTGTAA CAGCTTTTAC AATTGCTATA GCAATCAGTA TTGTACAGCA GATTCCTCTA 
TCGTTCTTTA TTAGACGTAA AATGATAAAA TAA

Protein sequence

MQNDMSVVLR AGKLLIESGA EVYRVEDTMK HFAKALQIEN FEAYVVSSSI IASGINRYGK 
QEAKVCNTDG VTANLGRLEA VNNLSRQIAK QDLVSPEEIV KQLDLIEHQK DYSLLVTLIS 
YFCGAGSFSL ALGSSLLDSF SAAVTGLILG YFLNLMESRI HTGFLLTILG SSVVALSANL 
LYFSGLGEHR SIIILGALMV MVPGAAFVNS VREFSQNNFS TGLALIMSAL LICISISAGV 
AITIEIIPFA EQMTGSFSGV PNTILEIIIR TLMAGLGTIA FSILYHVPKR YFLDLGILGA 
ISWMLYLILW QQFHMDAIAV FFPGLFITYF SRLLAAKRKC PATVFLATSM FPLIPGLSFY 
RAVYFLLTGA DAVAMEYFRS CFVTAFTIAI AISIVQQIPL SFFIRRKMIK