Gene SAG1407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1407
Symbol
ID	1014216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1414765
End bp	1416882
Gene Length	2118 bp
Protein Length	705 aa
Translation table	11
GC content	37%
IMG OID	637316583
Product	cell wall surface anchor family protein
Protein accession	NP_688405
Protein GI	22537554
COG category
COG ID
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAA TCAACAAATA TTTTGCAATG TTCTCGGCAT TGTTACTGAC TTTAACGTCA 
TTGCTCTCAG TTGCACCAGC GTTTGCGGAT GAAGCAACAA CTAATACAGT GACTTTGCAC 
AAGATTTTGC AAACCGAATC AAATCTTAAC AAAAGTAACT TCCCAGGAAC TACAGGTCTT 
AACGGAAAAG ACTACAAAGG TGGAGCTATT TCTGACCTTG CTGGTTACTT TGGCGAGGGA 
TCTAAAGAAA TCGAAGGTGC GTTCTTTGCT TTAGCTTTGA AAGAAGATAA AAGTGGTAAA 
GTGCAATATG TTAAGGCAAA AGAAGGTAAC AAATTAACAC CAGCCTTAAT TAATAAAGAT 
GGTACTCCTG AAATAACAGT AAATATTGAT GAGGCCGTGT CTGGATTGAC ACCAGAGGGA 
GATACTGGAC TTGTTTTCAA CACCAAAGGA TTGAAAGGCG AGTTTAAAAT TGTTGAAGTT 
AAATCAAAAT CTACTTACAA CAATAATGGT TCCCTCCTGG CTGCTTCAAA AGCGGTTCCA 
GTTAACATCA CTCTTCCATT GGTAAATGAA GATGGTGTTG TTGCTGATGC CCATGTTTAT 
CCAAAGAACA CTGAAGAAAA ACCAGAAATT GATAAAAACT TTGCTAAAAC AAACGATTTG 
ACAGCATTGA CAGATGTTAA TAGACTTTTG ACAGCTGGCG CAAATTATGG TAATTATGCA 
CGTGACAAAG CAACTGCTAC TGCTGAAATC GGTAAAGTTG TTCCTTATGA AGTTAAAACA 
AAAATTCACA AAGGTTCTAA ATACGAAAAC TTGGTTTGGA CAGATATAAT GTCAAATGGT 
TTGACAATGG GTTCAACTGT TAGCCTTAAA GCTTCAGGAA CTACAGAAAC TTTTGCTAAG 
GATACAGACT ATGAACTTAG CATTGATGCC CGTGGTTTCA CATTAAAATT CACAGCTGAT 
GGATTGGGCA AATTGGAAAA AGCAGCTAAA ACAGCTGATA TTGAATTTAC ATTGACTTAT 
AGTGCTACTG TTAATGGTCA AGCAATTATT GATAATCCAG AATCCAATGA TATCAAATTG 
TCGTATGGTA ACAAACCAGG TAAAGACTTG ACTGAACTTC CTGTTACACC TTCAAAGGGT 
GAAGTAACAG TTGCTAAAAC TTGGTCTGAC GGAATTGCAC CTGATGGTGT AAACGTTGTT 
TACACATTGA AAGATAAAGA TAAAACTGTT GCTTCAGTAT CATTGACAAA AACATCTAAA 
GGTACAATCG ACCTTGGAAA TGGTATCAAA TTTGAAGTAT CTGGTAACTT CTCGGGTAAA 
TTCACTGGTC TAGAAAACAA ATCATACATG ATCTCAGAAC GTGTTTCTGG TTACGGAAGT 
GCAATAAATC TAGAAAATGG TAAAGTAACC ATTACCAATA CCAAAGATTC TGATAACCCA 
ACACCATTGA ACCCAACTGA ACCAAAAGTT GAAACTCATG GTAAGAAATT TGTCAAAACT 
AATGAACAAG GTGACCGTTT GGCTGGTGCA CAATTCGTTG TGAAAAACTC AGCAGGTAAA 
TACCTTGCTC TTAAAGCAGA TCAATCAGAA GGTCAAAAAA CTTTAGCTGC TAAGAAAATA 
GCTTTAGATG AAGCTATCGC TGCTTATAAC AAGTTGTCTG CAACAGACCA AAAAGGTGAA 
AAAGGAATTA CTGCAAAAGA ACTTATCAAA ACTAAACAAG CAGATTACGA TGCAGCCTTC 
ATTGAGGCTC GTACAGCTTA TGAGTGGATA ACAGATAAGG CTAGAGCCAT TACCTACACT 
TCAAACGATC AAGGTCAATT TGAAGTTACA GGTCTTGCAG ACGGTACTTA CAACCTTGAA 
GAAACACTTG CTCCAGCAGG ATTTGCTAAG TTGGCAGGTA ATATTAAGTT TGTAGTTAAT 
CAAGGGTCAT ACATAACAGG TGGTAACATT GACTACGTTG CTAACAGCAA CCAAAAAGAT 
GCGACACGTG TAGAAAATAA AAAGGTAACA ATCCCACAAA CAGGTGGTAT TGGTACAATT 
CTTTTCACAA TTATTGGTTT AAGCATTATG CTTGGAGCAG TAGTTATCAT GAAAAGACGC 
CAATCAAAGG AAGCTTAA

Protein sequence

MKRINKYFAM FSALLLTLTS LLSVAPAFAD EATTNTVTLH KILQTESNLN KSNFPGTTGL 
NGKDYKGGAI SDLAGYFGEG SKEIEGAFFA LALKEDKSGK VQYVKAKEGN KLTPALINKD 
GTPEITVNID EAVSGLTPEG DTGLVFNTKG LKGEFKIVEV KSKSTYNNNG SLLAASKAVP 
VNITLPLVNE DGVVADAHVY PKNTEEKPEI DKNFAKTNDL TALTDVNRLL TAGANYGNYA 
RDKATATAEI GKVVPYEVKT KIHKGSKYEN LVWTDIMSNG LTMGSTVSLK ASGTTETFAK 
DTDYELSIDA RGFTLKFTAD GLGKLEKAAK TADIEFTLTY SATVNGQAII DNPESNDIKL 
SYGNKPGKDL TELPVTPSKG EVTVAKTWSD GIAPDGVNVV YTLKDKDKTV ASVSLTKTSK 
GTIDLGNGIK FEVSGNFSGK FTGLENKSYM ISERVSGYGS AINLENGKVT ITNTKDSDNP 
TPLNPTEPKV ETHGKKFVKT NEQGDRLAGA QFVVKNSAGK YLALKADQSE GQKTLAAKKI 
ALDEAIAAYN KLSATDQKGE KGITAKELIK TKQADYDAAF IEARTAYEWI TDKARAITYT 
SNDQGQFEVT GLADGTYNLE ETLAPAGFAK LAGNIKFVVN QGSYITGGNI DYVANSNQKD 
ATRVENKKVT IPQTGGIGTI LFTIIGLSIM LGAVVIMKRR QSKEA