Gene SAG0535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0535
Symbol
ID	1013338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	550545
End bp	552065
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	35%
IMG OID	637315736
Product	zinc ABC transporter, zinc-binding adhesion liprotein
Protein accession	NP_687564
Protein GI	22536713
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin [COG3443] Predicted periplasmic or secreted protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0968782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAGA AATTTCTTTT ATTGATGAGC TTTGTAGCTA TGTTTGCAGC TTGGCAACTT 
GTTCAAGTTA AACAAGTTTG GGCTGATAGT AAACTTAAAG TGGTAACAAC TTTTTACCCA 
GTTTATGAGT TTACAAAAAA TGTCGTTGGT GATAAAGCTG ATGTATCTAT GTTAATTAAA 
GCAGGTACAG AACCGCATGA TTTTGAACCA TCAACTAAAA ACATCGCTGC CATCCAAGAT 
TCAAATGCTT TTGTTTACAT GGATGATAAC ATGGAAACTT GGGCTCCAAA AGTAGCTAAG 
TCAGTTAAAT CCAAAAAAGT AACAACTATT AAAGGTACTG GCGATATGTT ACTTACTAAA 
GGCGTCGAAG AAGAAGGTGA AGAACATGAA GGACATGGTC ATGAAGGGCA TCATCATGAA 
CTTGACCCAC ACGTATGGTT GTCTCCAGAA CGTGCGATTT CTGTTGTAGA AAACATCCGT 
AATAAATTTG TCAAAGCTTA TCCAAAAGAT GCAGCTTCAT TTAACAAAAA TGCAGATGCT 
TACATTGCAA AATTAAAAGA GCTTGACAAA GAATACAAAA ATGGTTTGTC AAATGCTAAA 
CAAAAGAGTT TTGTGACTCA ACACGCAGCG TTTGGTTACA TGGCGCTTGA TTACGGTTTA 
AATCAAGTTC CAATTGCTGG TCTTACTCCA GATGCAGAAC CTTCATCAAA ACGTTTAGGC 
GAATTAGCTA AATACATCAA GAAATATAAC ATCAACTACA TTTATTTTGA AGAAAATGCT 
TCAAATAAAG TTGCTAAAAC TTTAGCAGAT GAAGTTGGCG TGAAAACAGC TGTGCTTAGT 
CCACTTGAAG GACTTTCTAA AAAAGAAATG GCAGCTGGCG AAGATTACTT CTCAGTTATG 
AGACGTAATT TGAAAGTTCT TAAAAAGACA ACAGATGTTG CAGGTAAAGA AGTAGCTCCT 
GAAGAAGATA AAACTAAAAC AGTTGAAACA GGTTACTTTA AAACTAAAGA TGTTAAAGAC 
CGTAAATTGA CAGATTACTC TGGTAATTGG CAATCAGTAT ATCCTCTTCT TCAAGATGGG 
ACACTTGATC CAGTTTGGGA TTACAAAGCT AAATCTAAAA AAGATATGAC TGCTGCAGAG 
TACAAAAAAT ATTATACAGC AGGTTACAAG ACTGACGTAG AATCAATCAA GATTGATGGT 
AAAAAACATC AAATGACCTT TGTACGTAAT GGTAAATCAC AAACATTTAC ATACAAATAT 
GCAGGTTACA AAATCTTAAC TTATAAAAAA GGTAATCGTG GAGTACGTTA TCTCTTTGAA 
GCTAAAGAAA AAGATGCTGG TCAATTCAAA TATATCCAAT TTAGTGACCA TGGTATTAAA 
CCGAATAAAG CTGAACACTT CCATATCTTC TGGGGTTCAG AAAGCCAAGA AAAATTATTT 
GAGGAAATGG AAAACTGGCC AACATACTTC CCAGCTAAAA TGTCTGGACG TGAAGTTGCC 
CAAGACCTTA TGTCTCATTA A

Protein sequence

MRKKFLLLMS FVAMFAAWQL VQVKQVWADS KLKVVTTFYP VYEFTKNVVG DKADVSMLIK 
AGTEPHDFEP STKNIAAIQD SNAFVYMDDN METWAPKVAK SVKSKKVTTI KGTGDMLLTK 
GVEEEGEEHE GHGHEGHHHE LDPHVWLSPE RAISVVENIR NKFVKAYPKD AASFNKNADA 
YIAKLKELDK EYKNGLSNAK QKSFVTQHAA FGYMALDYGL NQVPIAGLTP DAEPSSKRLG 
ELAKYIKKYN INYIYFEENA SNKVAKTLAD EVGVKTAVLS PLEGLSKKEM AAGEDYFSVM 
RRNLKVLKKT TDVAGKEVAP EEDKTKTVET GYFKTKDVKD RKLTDYSGNW QSVYPLLQDG 
TLDPVWDYKA KSKKDMTAAE YKKYYTAGYK TDVESIKIDG KKHQMTFVRN GKSQTFTYKY 
AGYKILTYKK GNRGVRYLFE AKEKDAGQFK YIQFSDHGIK PNKAEHFHIF WGSESQEKLF 
EEMENWPTYF PAKMSGREVA QDLMSH