Gene SAG1381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1381
Symbol
ID	1014190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	1390493
End bp	1392637
Gene Length	2145 bp
Protein Length	714 aa
Translation table	11
GC content	35%
IMG OID	637316557
Product	sulfatase
Protein accession	NP_688379
Protein GI	22537528
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0400928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAAA TTAAAGATTT TGCTAGCCGT GCGATCAATA CACGACTCGG CTTTATTTTA 
TTGTTAGTAG TTATATATTG GTTAAAGACA ATTTGGGCTT ACCATACTGA TTTTAATTTA 
GGTTTAGAAA ATTCCTATCA GTTGTTTTTG ACCATTATAA ACCCCATCCC CTTAGGACTC 
TTAATCATAG GTTTGGCCTT ATATGTTAAG CGAACCAAAG CTTTTTATAT TACCGCTTTT 
ATCACCTATG CTATCGTAAA TATCCTTCTA ATTGCAAACG CAATCTACTA TAGAGAGTTT 
TCCGATTTCA TTACAGTTAG CGCCGTCTTG GCTAGTAGTA AAACTTCGGC TGGCCTTGGA 
GACTCTGCTC TTAATCTATT GAGAATTTGG GATCTTGTCT ACGTTTTCGA TTTCATTATC 
CTTATTTTCT TATTTGCAAC CAAGAAAATC CACTTAGATG ATCGTCCATT TAATAAACGT 
GCTAGTTTTT CTATCACAGC TTTGTCTGGT TTACTCTTTT CAATTAACTT ATTCTTAGCT 
GAAATTGATC GTCCAGAACT ACTAAGTCGT GGTTTTTCAA ACACCTATAT TGTTAAAGCT 
CTTGGCTTGC CATCATTTTC GATTTATAGT GGTAATCAAA CTTATCAAGC ACAGAAAGAA 
AGAAATGGTG CCACTGCACA AGAATTAGCG ACTGCCAAAA AATATGTAGC AGAGCATTAT 
GCCAAACCCA ATCCAGAATA TTATGGTATC GGAAAAGGGC GAAACGTTAT CATGATTCAT 
TTGGAGAGTT TTCAACAATT CTTGATTGAC TATAAATTAA ATATTGATGG TAAAGAACAT 
GTGGTTACTC CATTTATTAA CAGCCTTTAT CATTCGAAAG AGACTGTCTC CTTCTCTAAC 
TTCTTCCATC AAGTCAAAGC TGGTAAGACA TCCGATGCTG AGACACTCAT GGAAAACTCA 
CTTTTTGGTC TAAGTAGTGG TTCATTCATG GTTAATTATG GTGGTGAAAA TACACAATTT 
GCTGCTCCAC ATATCTTAGC TCAAAATGGA GGTTACAGTA GTGCGGTCTT CCACGGAAAC 
GTCGGAACAT TTTGGAATAG AAATAATGCT TACAAACAGT GGGGTTATGA CTACTTCTTT 
GACTCTAGCT ACTTCTCAAA ACAAACCAAA GATAATTCAT TCCAATACGG TTTGAATGAT 
AAATATATGT TTGCTGACTC TATCAAATAT CTAGAGCACA TGCAACAACC ATTTTATACT 
AAATTTATTA CAGTAAGTAA CCATTACCCT TACACAAGTT TGAAGGGAGA GTCTGACGAA 
GAGGGATTCC CACTTGCAAA GACTAACGAT GAAACGATTA ACGGTTATTT TGCCACAGCA 
AACTACCTTG ATACAGCTCT TAAATCATTT TTTGAATATC TAAAAGCTGC TGGTGTGTAT 
GATAATTCTA TTATTGTAAT GTATGGGGAT CACTACGGTA TTTCTAATAC ACGCAATCCT 
AGCTTAGCTG AATTATTAGG TAAAGACCCT GAAACATGGT CTGAATACGA CAACGCTATG 
TTACAACGTG TTCCATATAT GATTCACATT CCTGGCTATT CAAAAGGTTT TATCAGTAAT 
ACATACGGTG GTGAGGTAGA TAATTTACCA ACTTTACTTC ATATTCTAGG AATAGATACG 
TCTAAATATA CTCAGTTAGG ACAAGACTTA TTATCTAAAG ATAATAAACA AATGGTCGCT 
ATGAGAACAA CTGGTCAGTA TATTACTCCT AAATACACTA ACTATAGTGG ACATCTCTAT 
TACACTGATT CAGGACAAGA AATCACAAAT CCTGATGAAA CAACTAAAGC TGAAATAAAA 
GCTATTCGAG ATGCTACTAA TAAACAATTA TCTACAAGTG ATTCGATTCA AACTGGAGAT 
TTACTACGAT TTGATGAAAA CAATGGTTTG AAAACTGTAG AAGTTGAAAA ATTCAATTAC 
ACACATTCTC TTAAAGCACT CAAAGCTAAA GAACGTAAAT TGAAAGATCG TTCAACAAGC 
ATATACAGCA AACATAACAA CAAATCAACA GTTGATCTCT TCCATGCTCC AAGTTACTTG 
GAATTGCAAG ATCCTAATAA GACACATAAA ACATCTAAAA AATAA

Protein sequence

MKKIKDFASR AINTRLGFIL LLVVIYWLKT IWAYHTDFNL GLENSYQLFL TIINPIPLGL 
LIIGLALYVK RTKAFYITAF ITYAIVNILL IANAIYYREF SDFITVSAVL ASSKTSAGLG 
DSALNLLRIW DLVYVFDFII LIFLFATKKI HLDDRPFNKR ASFSITALSG LLFSINLFLA 
EIDRPELLSR GFSNTYIVKA LGLPSFSIYS GNQTYQAQKE RNGATAQELA TAKKYVAEHY 
AKPNPEYYGI GKGRNVIMIH LESFQQFLID YKLNIDGKEH VVTPFINSLY HSKETVSFSN 
FFHQVKAGKT SDAETLMENS LFGLSSGSFM VNYGGENTQF AAPHILAQNG GYSSAVFHGN 
VGTFWNRNNA YKQWGYDYFF DSSYFSKQTK DNSFQYGLND KYMFADSIKY LEHMQQPFYT 
KFITVSNHYP YTSLKGESDE EGFPLAKTND ETINGYFATA NYLDTALKSF FEYLKAAGVY 
DNSIIVMYGD HYGISNTRNP SLAELLGKDP ETWSEYDNAM LQRVPYMIHI PGYSKGFISN 
TYGGEVDNLP TLLHILGIDT SKYTQLGQDL LSKDNKQMVA MRTTGQYITP KYTNYSGHLY 
YTDSGQEITN PDETTKAEIK AIRDATNKQL STSDSIQTGD LLRFDENNGL KTVEVEKFNY 
THSLKALKAK ERKLKDRSTS IYSKHNNKST VDLFHAPSYL ELQDPNKTHK TSKK