Gene SAG0644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0644
Symbol
ID	1013448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	630361
End bp	631569
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	35%
IMG OID	637315837
Product	AraC family transcriptional regulator
Protein accession	NP_687664
Protein GI	22536813
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTACAT TCGATTTTAA ACATGTTCAA ACATTGCATA CCATATCTCA ACTACCTATT 
TCAGTCATGT CACGAGACAA GGAACTCGTT CAGTTATATG GTAACGAAGA CTATCTGTTG 
CCTTACTATC AGTTTTTAAA ACATTTAGCT ATCCCTTATA ACCAAGATAT CACTGTTTAT 
GAGGGTCTTT TTGAAGAATC ATTCTTAATT TTTCCTGTCT GTCAATATCT TATTGCTATT 
GGACCATTTT ATCCCTATAG CCCTGATATC AATAGGCAAG AACAGTTATC CAGTCGCTTT 
CTAGAACAAT TTTCTCATCG TAATAAAAAA GAAATCTTAT CCTATATAAA GCTTGTCCCT 
TGTTTTCCTA CTACCAGTAT ACGTAGTCTT CTTGTGTCTA TCGATGCCTT TTTCCAAACA 
CAGTTTGAGG CTAGTTGCCA ACAAGTCATC AATCATTTAT TAGAAGAGTC AGAACAGATT 
GTTGCGGATC CTGATATTGT TCTTCACCTA AAACATACTA AGAAAAACTC TTTTCAGTTA 
CCCACTGTTT TAAACCATCT CAATCACATT ATTGATCTCG TTAAGCTGGG TAACACTCAA 
CTGTTAAAGC AAGAAATTAA TCGCCTCCCA TCATCCAGTG TTACCTCATC TTCAATCCCT 
GCCCTAAGAG CTGAAAAGAA CTTAACTGTT GTTTACTTAA CAAAATTACT AGAATTAAGT 
TTCGAGGAAA ATACTGATGT GGCTAAAAGT TATGCGCTGG TAAAGCACTA TATGGCTTTA 
AACGAAGAGG CTCCTGATCT TATTGATGTT TCAAGAATTC GCTGTGCAGC TCTTATTGAT 
TTTTCAGAAT CCTTAACCAA TAAGAGCATC TCTGACAAGC AGCAAATGTA CAATAGTATT 
CTCCATTATG TGGACAACCA CCTCTACTCC AAACTCAAAG TATCTGATAT TGCCAACTAC 
CTATATATCT CAGATTCCCA CTTACGCTCA GTTTTTAAAA AATACTCTGA CATTTCCTTG 
CAAAGTTATA TTCTAAAGGC AAAAATTAAG GAGGGACAAT TACTACTGCA AAGAGGGGTA 
CCGATTGGGG AAGTAGCGAA ATTATTACAT TTTTACGACA CCACACATTT TCTTAAAACC 
TTTAAAAAAT ACGTGGGAAT ATCTTCAAAC GAATATCTTA CTAAATATCG TGAGACCTCA 
TGCCAGTAA

Protein sequence

MVTFDFKHVQ TLHTISQLPI SVMSRDKELV QLYGNEDYLL PYYQFLKHLA IPYNQDITVY 
EGLFEESFLI FPVCQYLIAI GPFYPYSPDI NRQEQLSSRF LEQFSHRNKK EILSYIKLVP 
CFPTTSIRSL LVSIDAFFQT QFEASCQQVI NHLLEESEQI VADPDIVLHL KHTKKNSFQL 
PTVLNHLNHI IDLVKLGNTQ LLKQEINRLP SSSVTSSSIP ALRAEKNLTV VYLTKLLELS 
FEENTDVAKS YALVKHYMAL NEEAPDLIDV SRIRCAALID FSESLTNKSI SDKQQMYNSI 
LHYVDNHLYS KLKVSDIANY LYISDSHLRS VFKKYSDISL QSYILKAKIK EGQLLLQRGV 
PIGEVAKLLH FYDTTHFLKT FKKYVGISSN EYLTKYRETS CQ