Gene SAG1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1803
Symbol
ID	1014612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1798830
End bp	1800347
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	38%
IMG OID	637316971
Product	carbohydrate kinase
Protein accession	NP_688793
Protein GI	22537942
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTATT ACCTTAGTAT TGACTACGGC GGTACAAATA CCAAGGCGCT TATTTTTGAC 
AAATTAGGAC ACCAAATCGC TGTTTCGAGT TTTGAAACTT TAAAAAATGA GACTCAATCT 
GGTCATCGTC AAGTAAACCT TGTTAAAACG TGGAATGCTA TAACTTCTGC TATTAGAGAG 
GTTATTCAAA TCTCAAAACT CAGCCCTGAG CAGATTAGTG CAGTAGCATG TATTGGACAT 
GGGAAAGGTC TTTATCTGCT AGATAATAAG TTGGAGCCAC TTGAACAAGG AATTTTGTCT 
ACAGATAATC GTGCCAAAGA TTTGGCGCAA TATTTCGAAT CTAAACTTGA TAATATTTGG 
GAGTTGACTC GGCAACATAT TTTCCCTTCA CAAAGTCCAG TTATTTTACG TTGGCTTAAA 
GATTATCAGC CCGAAACCTA TAAATCAATA GGGGCGGTCC TTTCTGCAAA GGACTTTATT 
CGGTATAAGC TTACAGGAAA AGTACAGCAA GAATATGGTG ACGCTTCAGG TAATCATTGG 
ATAAATTTCC AAACAGGAAC TTATGATCCA GCTATTTTAG ATTTTTTTGG CATTAGAGAG 
ATAGAAAACT CACTTCCTGA ACTTATAGAT AGTGCAGATT TAGTTCCTGG GGGAATTAGT 
TCTCAAGCAG CAAAAGAGAC TGGTCTTGTA GAAGGGACCC CCGTTGTTGG AGGGCTCTTT 
GACATCGATG CTTGTGCTCT TGGATCAGGT GTTTTAGAGT CAGATACTTT TAGTGTTATT 
TCGGGAACTT GGAATATTAA TACATATCCA AGTTTAAAAC CAGCAAAGCA AGATAGTGGT 
CTTATGACTT CCTATTTTCC AGATCGTCGT TATCTCTTAG AGGCAAGTAG CCCTACTTCT 
GCAGGGAATC TTAATTTTAT GTTAAAAATG CTCATGCATC AAGAAATTGA TAACGCTAAA 
TCTAGTGGAG GTTCTATCTA TGATAATTTA GAAGAATTTC TCACTCATAC TGATGCTACA 
CATCATGGAC TTATTTTCTT TCCGTTTCTT TACGGTAGTA ACACATCACA AGATGCTAGC 
GCTTGCTTTT TTGGGCTAAC AACTAAATCG ACGAAATCTC AGATGATACG TGCGGTATAT 
GAAGGTATTG CGTTTGCACA TAAGCAGCAT ATCACTGATT TAATAAAAAG TAGGGGCAGT 
GTGCCAAAAA TAATTCGTTT CTCTGGCGGA GCTACCAACT CACCAGCATG GATGCAAATG 
TTTTCTGATA TCTTAAACTT TCCTATTGAA ACAGTAGAAG GCACAGAATT AGGAGGGTTA 
GGAGGAGCTA TTTTAGCACG TCATGCTTTA GATAAGATTT CGTTAAAGGA AGCAGTCCAA 
GATATGGTTC GTGTAAAAGC TATTTATAAA CCTCAATTAT CCGAAGTAAA GGGGTACAAA 
AAAAAATATC ACGCTTACCA AAAATTATTA GAAACACTGG ATCCTATTTG GTCGGAACTC 
GGTCATCTGA ATAAGTAG

Protein sequence

MTYYLSIDYG GTNTKALIFD KLGHQIAVSS FETLKNETQS GHRQVNLVKT WNAITSAIRE 
VIQISKLSPE QISAVACIGH GKGLYLLDNK LEPLEQGILS TDNRAKDLAQ YFESKLDNIW 
ELTRQHIFPS QSPVILRWLK DYQPETYKSI GAVLSAKDFI RYKLTGKVQQ EYGDASGNHW 
INFQTGTYDP AILDFFGIRE IENSLPELID SADLVPGGIS SQAAKETGLV EGTPVVGGLF 
DIDACALGSG VLESDTFSVI SGTWNINTYP SLKPAKQDSG LMTSYFPDRR YLLEASSPTS 
AGNLNFMLKM LMHQEIDNAK SSGGSIYDNL EEFLTHTDAT HHGLIFFPFL YGSNTSQDAS 
ACFFGLTTKS TKSQMIRAVY EGIAFAHKQH ITDLIKSRGS VPKIIRFSGG ATNSPAWMQM 
FSDILNFPIE TVEGTELGGL GGAILARHAL DKISLKEAVQ DMVRVKAIYK PQLSEVKGYK 
KKYHAYQKLL ETLDPIWSEL GHLNK