Gene SAG0099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0099
Symbol
ID	1012867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	108709
End bp	109956
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	34%
IMG OID	637315272
Product	GntR family transcriptional regulator
Protein accession	NP_687135
Protein GI	22536284
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAACCA AAGTTGAAGA GATTCGCTCA TATTTGATAG CTTCTATACA AAATGGTAAG 
TTGGCTCCAG GAGATCGCCT ACCATCTATA AGACAGTTAG CTAATCAATT TTCCTGTAAC 
AAAGATACAG TCCAACGAGT TTTGATGGAA TTGCGTTTTG ATAATTATAT CTATGCAAAG 
CCTAGGTCAG GCTATTACGT CTTTGATTCT CATCAAGAGG AAGTTGAAGA AGGGGTTAGT 
TTACCAAACT CTGAGATTGC AAATATAGCT TATGATGATT TTAGATTGTG TTTGAATGAG 
ACCCTTATTG GTAGGGAAGA TTACCTTTTC AATTATTACT ATCGTCAAGA AGGTCTTCTT 
GATTTAAGTA AAGCAGTGGC TAAATTAATG GAAGAAACAG GGGTCTATGT TCCCCTTGAT 
GATATTGTTA TTACGGCTGG TACTCAACAG GCATTATTTA TTTTGACACA GGTTACCTTT 
CCAAATCGAA AATCTCGAGT TTTAATAGAA GAACCGACCT ATCCTCGTAT GATTGAACTA 
ATCAAAACAC AAAATTTACC CTATGAAACT ATTTCTCGAG GTACTCATGG AATTGATTTT 
CAGCGTTTAG AGGAGATTTT CCAGACACAA TCAATTAAGT TTTTTTATGT TATACCTCGC 
ATGCATAATC CTTTGGGAAC ATCCTATAAT CCGGTAGAGA TGAAAAGATT AATAGAGATG 
GCAGAGAAGT ATGATGTTTA TATTGTGGAA GATGACTATA TGTCTGATTT TGCAAGTCAG 
TCACCATTAC ATTATTATGA TACTCACGGG CGTGTTATTT ATCTAAAATC TTTTTCAAAG 
GCTATTTTCC CTGCTTTAAG ATTAGCTGCG ATTTGTTTAC CACAAGCTTT AAAATCAACA 
TTTATGGCTT ACAAGAAGTT GATGGATTAT GATACTAATC TGATTTTACA AAAAGCATTA 
GCGCTTTATA TTGAAAATGG CCTTTATGCT AAGAATAGTC AATATTTGAA ATATCGTTAT 
CAGAAAGACC TTGCAAATTC AAAATCTATT TTAGCTGATC ACCCTAATCT ACCCTCATAT 
AGTTTACATC ACGATAGTGT ATTATTTGAT TGTTCGAAAC TCGATAACTT TAAAATATTA 
CGGCAATACG GCGATACTTT GGAAAATTAT TTTTGTCAAA AATCGCATCA ATCTCTCTTA 
CAAGTAAAAA ATGATTCCTG CTTAAAGCAG TTCTTGGGAT CGTTGTAG

Protein sequence

MVTKVEEIRS YLIASIQNGK LAPGDRLPSI RQLANQFSCN KDTVQRVLME LRFDNYIYAK 
PRSGYYVFDS HQEEVEEGVS LPNSEIANIA YDDFRLCLNE TLIGREDYLF NYYYRQEGLL 
DLSKAVAKLM EETGVYVPLD DIVITAGTQQ ALFILTQVTF PNRKSRVLIE EPTYPRMIEL 
IKTQNLPYET ISRGTHGIDF QRLEEIFQTQ SIKFFYVIPR MHNPLGTSYN PVEMKRLIEM 
AEKYDVYIVE DDYMSDFASQ SPLHYYDTHG RVIYLKSFSK AIFPALRLAA ICLPQALKST 
FMAYKKLMDY DTNLILQKAL ALYIENGLYA KNSQYLKYRY QKDLANSKSI LADHPNLPSY 
SLHHDSVLFD CSKLDNFKIL RQYGDTLENY FCQKSHQSLL QVKNDSCLKQ FLGSL