Gene SAG1801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1801
Symbol
ID	1014610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1796304
End bp	1797983
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	35%
IMG OID	637316969
Product	BglG family transcriptional antiterminator
Protein accession	NP_688791
Protein GI	22537940
COG category	[K] Transcription
COG ID	[COG3711] Transcriptional antiterminator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTATTC TCGATAAAAA AAGTTATGAC CTCCTCTTTT ACCTATTGAA ATTAGAGGAA 
CCTGAAACAG TTATGGCAAT TGCCAACGCA CTTAATCAGT CTAGACGTAA AGTGTATTAT 
CACTTAGAGA AGATAAACGA TGCACTGCCT AGCGATGTGC CTCAGATTGT TAGTTATCCA 
CGTGTAGGAA TCTTGCTAAC AGAAAAACAA AAAGCAGCCT GTCGTCTTTT ATTAGATGAA 
GTGACTGATT ATAGTTACGT CATGAAAAGT AGTGAGAGGT TGCAGCTGTC TTTAGTATCT 
ATCGTAGTAG CTAAGGACCG CGTAACGATT GATAGGTTGA TGCAACTAAA CGATGTTTCT 
CGAAATACTA TCTTAAACGA TTTAAACGAA TTAAGAAGTG AGTTAGCAGA GAAAGAATAT 
AATTTACAGT TACAATCAAC AAAATGTCGT GGTTATTTTT TAGATGGTCA CCCATTGTCC 
ATTATCCAGT ACTTATATAA GCTCTTAGAT GATATCTACC ATAATGGAAG TAGTAGTTTT 
ATAGACCTTT TTAATCATAA ACTGTCTCAA GCTTTTGGTG CCAGCACTTA TTTTTCTAAA 
GAGGTTCTTG ATTATTTTCA TCATTATCTC TTCATTTCTC AACGAAGTCT AGGTAAGAAA 
ATCAACAGTC AAGATGGTCA GTTTATGATT CAGATTTTGC CTTTTATACT AATGGCTTAT 
CGTAAGATGC GATTAAGTCC TGAAGTACAG ACCTCTCTTA ATAGTGATTT TAGCTTGGTT 
TGGCAACGTA AGGAATATGA GATTGCTAAA GAGTTGGCTG ATGAGCTGGA AGAAAATTTT 
CAGTTATCAC TGGATGAGAT TGAAGTGGGA CTAGTAGCCA TGCTTATGCT TAGTTTCCGC 
AAGGACCGTG ACAATCATTT AGAGAGCCAG GATTATGATG ATATGCGAGC TACTCTAACC 
AGTTTTTTGA AAGAATTGGA AGAACGATAT CACCTTCACT TTGTTCATAA AAAGGACTTA 
CTAAGACAAC TTCTTACTCA CTGCAAGGCA CTCTTATATC GTAAACGTTA TGGTATTTTT 
TCTGTTAATC CTTTAACAGA GCATATTAAA GACAAATATG AAGAACTTTT TGCCATAACC 
TCGTCTTCTG TAAAGCTTTT AGAGAAAGCT TGGCAAATCA AATTGACCGA TGATGATGTA 
GCATATCTAA CGATTCATTT AGGAGGGGAA CTTCGTAATA GTCAACAATC TCCTAATAAA 
CTTAAGTTAG TTATTGTATC TGATGAAGGA ATAGCGATTC AGAAACTTCT TTTAAAGCAA 
TGTCAACGCT ACTTAACAAA TAGTGATATA GAAGCTGTTT TTACAACCGA ACAGTATCAA 
AGTGTGAGTG ATCTTATGCA TGTAGATATG GTTGTCTCTA CTAGTGATGC TTTAGAATCT 
CGTTTTCCGA TGTTAGTAGT TCACCCTGTT TTGACAGATG ATGATATTAT TCGCTTGATT 
CGCTTTTCTA AAAAAGGTAA CTGTGCAAAT AGTAATCAAT TTACCAATGA ACTTGAAAAA 
ACAATTGCTC AATATGTCAA GGAAGATAGT GAACGCTACG TGCTGAAATC TAAGATTGAG 
AAACTTATTC ATCAAGAATT GCTCCAAGAC GTCCTTCCCC TTCAAAGTAC AGTTTGTTAA

Protein sequence

MIILDKKSYD LLFYLLKLEE PETVMAIANA LNQSRRKVYY HLEKINDALP SDVPQIVSYP 
RVGILLTEKQ KAACRLLLDE VTDYSYVMKS SERLQLSLVS IVVAKDRVTI DRLMQLNDVS 
RNTILNDLNE LRSELAEKEY NLQLQSTKCR GYFLDGHPLS IIQYLYKLLD DIYHNGSSSF 
IDLFNHKLSQ AFGASTYFSK EVLDYFHHYL FISQRSLGKK INSQDGQFMI QILPFILMAY 
RKMRLSPEVQ TSLNSDFSLV WQRKEYEIAK ELADELEENF QLSLDEIEVG LVAMLMLSFR 
KDRDNHLESQ DYDDMRATLT SFLKELEERY HLHFVHKKDL LRQLLTHCKA LLYRKRYGIF 
SVNPLTEHIK DKYEELFAIT SSSVKLLEKA WQIKLTDDDV AYLTIHLGGE LRNSQQSPNK 
LKLVIVSDEG IAIQKLLLKQ CQRYLTNSDI EAVFTTEQYQ SVSDLMHVDM VVSTSDALES 
RFPMLVVHPV LTDDDIIRLI RFSKKGNCAN SNQFTNELEK TIAQYVKEDS ERYVLKSKIE 
KLIHQELLQD VLPLQSTVC