Gene SAG1448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1448
Symbol
ID	1014257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1461074
End bp	1462582
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	34%
IMG OID	637316622
Product	glycosyl transferase, group 1 family protein
Protein accession	NP_688444
Protein GI	22537593
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR02918] accessory Sec system glycosylation protein GtfA

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.622489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGTTT ATAATATAAA CCATGGAATT GGTTGGGCAA GCAGCGGTGT TGAGTACGCT 
CAAGCATACC GAGGTTCTGT TTTGAGAAAA CTTGGAATTG ATGCTAAGTT TATTTTTACA 
GATTTTTTTT CAGCTGATAA TATTATTAGC CTCACGCGAA ATATAGGTTT TCAGGATAAA 
GAAATTATTT GGTTATATAA TTTTTTTTCA GATATTGAGC TTGCCCCGAC AACTTTTAGT 
ATAGAAGATT TGCAAAAACA ATATCTTGGA AAACTTGTTC GAAAAGAAGA TAAAGGTCGG 
GTAATCAAGT TTTTCTACGA AGATGAAAAT ATCTATTTAA CAGTTTACCT TGATAATTTT 
AACAAGGATA AAGTGCATCG TGTAGAAATC GTTTCAAATA ACAACCTTAT CAGAAAAGAT 
TATTATAGTT ATACACGTAC TTTCTCAGAG TATTACTATC CTAAAGATGG TGTAGCTCAC 
CTTTATCAAC GTAGATTCTA CAATGAAGAT GAAAGTACAG CCTTTTTGGA GATGGTAGAA 
AATAGCTCAA GTCGTTTTAT TATCAATGGC AGACTTTTAC CATCCAAAGT AGCTTTTTTT 
GATTATTTTT TGGAATCAAT GACTTTCACT TCAAAAGATA TTATTCTTTT GGATAGAGGA 
ACTGATACCG CTCAGAGTCT TTTGCGCCAT GGTAAACCCG CTAAGCTAGG GACTGTTGTT 
CATGCGGAAC ATTTTAGTGA GAATGCTGTG ACTGCTGACA CTATTTTATG GAATAACTAT 
TACGATTATC AGTTTACTAA CGCTAATAGA TTTGATTTTT TTATTACCTC CACTGATAAA 
CAAACAGAAC TTTTGGAACA ACAATTTAAA CAATTTACAA ATCATAATCC TAGAATTATA 
ACTATCCCGG TAGGCTCAAT TGACAATCTT AAAATGCCAA TGGACAATCG CCGTCCGTAC 
TCTATTTTGA CAGCTTCACG CCTAGCTAGT GAAAAACATG TAGATTGGTT AGTACGTGCA 
GTTATTAGGA TAAGAGAAAT TCTTCCTGAA GTGACCTTTG ATATCTATGG ATCAGGTGGA 
GAAGAAGAAA AAATTAGAAA TATTATAAAT GCAGCCAATG CAACGGAATA CATTCGATTG 
ATGGGACATA AAAATCTCTC GAATGTTTAT CAAAATTATG AGTTATATTT GACAGCTTCT 
AAAAGTGAGG GGTTTGGCTT AACTTTACTT GAAGCTATTG GCGCAGGACT TCCTTTGATT 
GGGTTTGATG TTCGTTATGG TAATCAAACT TTTATCAAAG ACGGAGAAAA TGGTTATCTA 
ATTCCTCGAT TTGATATGGA TGATGAGGAA GCTATTGTAG AAGCTTTTAA AGAGAAAGTG 
TTACAATTAT TCCAACAGGA TCAAAAGGCT TTACGAGAAG CTTCTTACGC CATTGCCGAA 
GGATTCTTAA CAAATGAAGT AGAAGGAAAA TGGTATAACT TAGTTAAGGA GTTGGTACAA 
GATGATTAA

Protein sequence

MTVYNINHGI GWASSGVEYA QAYRGSVLRK LGIDAKFIFT DFFSADNIIS LTRNIGFQDK 
EIIWLYNFFS DIELAPTTFS IEDLQKQYLG KLVRKEDKGR VIKFFYEDEN IYLTVYLDNF 
NKDKVHRVEI VSNNNLIRKD YYSYTRTFSE YYYPKDGVAH LYQRRFYNED ESTAFLEMVE 
NSSSRFIING RLLPSKVAFF DYFLESMTFT SKDIILLDRG TDTAQSLLRH GKPAKLGTVV 
HAEHFSENAV TADTILWNNY YDYQFTNANR FDFFITSTDK QTELLEQQFK QFTNHNPRII 
TIPVGSIDNL KMPMDNRRPY SILTASRLAS EKHVDWLVRA VIRIREILPE VTFDIYGSGG 
EEEKIRNIIN AANATEYIRL MGHKNLSNVY QNYELYLTAS KSEGFGLTLL EAIGAGLPLI 
GFDVRYGNQT FIKDGENGYL IPRFDMDDEE AIVEAFKEKV LQLFQQDQKA LREASYAIAE 
GFLTNEVEGK WYNLVKELVQ DD