Gene SAG1175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1175
Symbol	cpsA
ID	1013982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1178207
End bp	1179664
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	32%
IMG OID	637316360
Product	capsular polysaccharide biosynthesis protein CpsA
Protein accession	NP_688184
Protein GI	22537333
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAATC ATTCGCGCCG TCACCAAAAG AAACACTCAC ATACACCTCT ACGGGTGATT 
AATTTATTTC TTTTGGTGAT TTTTATTTTG TTAAGTGTAG TCTCATTATT TCTTATGTAT 
CGTCACCATT TTTTGGCATT TAGACACCTG AACGTCATTT ATGGAGTTGT AATTGTTTTA 
ATCATTTTAG TAAGTTTATT TCTTTGTATT AAGAATAAAG CTAGAATTTT TACAACTATA 
ATTTTAGTAT TAGCTTCTAT TTTCGTTGCT ACTACTTTAT ATGGATTTAA GTCAACCATT 
GATTTGACAA ATAATCTAAA TAAAACTGCT TCATACTCTG AAATTGAGAT GAGTGTAGTT 
GTACCAAAAG ATTCTAAAAT AACCAATATA GAAGCTGTCA GCAAATTAGC CGCACCAGTT 
AAAAACGATA CTTCAAATAT TACTGATTTG ATAGAACATA TAAAATCAGA AAAAGGAATC 
TCTATTACAC CACAAAAAAC AGATTCTTAC CAGGATGCAT ACAATAGAAT TAAAAGTGGT 
GATAGTCAGG CTATGGTTTT AAATAATGCT TATGTTAGCT TAATTGAACT TAGCACCCCT 
GATTTTAAAT CGCAGATAAA AACGATTTAT ACTTACAAAA TTAAGAAAAA AATTAATCGT 
AAAAATACTA ATCATAAAGA AGGGGTATTT AATATCTATA TTAGCGGTAT TGATACTTTT 
GGCTCTATAT CAACAGTATC AAGATCTGAT GTAAATATTA TTATGACGGT TAATACCAAT 
ACCCACAAAG TATTGTTAAC GACAACACCA CGAGATGCCT ATGTAAAAAT TCCAGATGGT 
GGGGGCAATC AATATGATAA ATTAACCCAT GCAGGTTTGT ATGGCGTTGA GACATCAATG 
AAAACACTTG AAAACCTTTA CGACATCAAC CTTGATTATT ATGCTAGAAT TAATTTTTCA 
TCATTTTTAA AATTAATAGA CCTCTTGGGA GGAGTGACAG TTTATAACGA TCAAGCTTTT 
ACAAGTAAAC ATGGTAATTT TGACTTCCCT GTTGGTCAAG TAACATTGAA TTCTGAGCAG 
GCTTTGGGCT TTGTTAGAGA ACGTTATTCT CTACAAGGAG GCGATAACGA TAGAGGTAGA 
AATCAAGAAA AAGTGATTGC AGCTATTATA AATAAGTTAG CTTCTAGTCA GTCAGTAACA 
AAATTAAATA GCATTACCTC ACAGCTCCAA ACGTCCGTTC AAACTAATAT GACTATTGAT 
AACATTAATG ATTTGATTAA CAATCAATTG TCAACTGGAC AACGCTTCAC TGTCGAGTCA 
CAAGCATTAA CTGGTCATGG TTCAACGGGT GAACTCCCTT CATATGCAAT GCCAGGAGCT 
CAACTTTATA TGATGTCAAT TGATCAATCT AGCTTATCTA ATGCAAAATC AAAAATTAAG 
AACACAATGG AGGAATAA

Protein sequence

MSNHSRRHQK KHSHTPLRVI NLFLLVIFIL LSVVSLFLMY RHHFLAFRHL NVIYGVVIVL 
IILVSLFLCI KNKARIFTTI ILVLASIFVA TTLYGFKSTI DLTNNLNKTA SYSEIEMSVV 
VPKDSKITNI EAVSKLAAPV KNDTSNITDL IEHIKSEKGI SITPQKTDSY QDAYNRIKSG 
DSQAMVLNNA YVSLIELSTP DFKSQIKTIY TYKIKKKINR KNTNHKEGVF NIYISGIDTF 
GSISTVSRSD VNIIMTVNTN THKVLLTTTP RDAYVKIPDG GGNQYDKLTH AGLYGVETSM 
KTLENLYDIN LDYYARINFS SFLKLIDLLG GVTVYNDQAF TSKHGNFDFP VGQVTLNSEQ 
ALGFVRERYS LQGGDNDRGR NQEKVIAAII NKLASSQSVT KLNSITSQLQ TSVQTNMTID 
NINDLINNQL STGQRFTVES QALTGHGSTG ELPSYAMPGA QLYMMSIDQS SLSNAKSKIK 
NTMEE