Gene SAG0330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0330
Symbol	celB
ID	1013119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	338026
End bp	339327
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	37%
IMG OID	637315522
Product	PTS system, cellobiose-specific IIC component
Protein accession	NP_687364
Protein GI	22536513
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.240964
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAGT TTGATAGTCA GAAAATAATT ACTCCGATTA TGAAGTTTGT CAATATGCGA 
GGGATTATTG CACTCAAAGA TGGCATGCTA GCAATTCTAC CACTAACAGT TGTTGGGAGT 
CTCTTTTTAA TATTAGGGCA GCTTCCATTT AAAGGTCTTA ATCAAGCCAT AGCTAATGTT 
TTTGGACCAG AATGGACAGA ACCATTTATG CAAGTTTATT CAGGAACTTT TGCGATTATG 
GGCTTGATTT CCTGTTTTGC AATTGCTTAT GCTTATGCTA AAAATAGTAG TGTAGAACCG 
TTACCTGCTG GCGTTTTATC ACTTTCGTCT TTCTTTATTT TAATGAAATC ATCTTATATT 
CCTGTAAAAG GAGAAGCAAT AGCGGATGCT ATTTCTAAGG TTTGGTTTGG CGGTCAGGGG 
ATTATTGGAG CAATTATTAT TGGCTTAGTA GTTGGTGCTA TCTATACATG GTTTATCCAA 
CATCATATTG TTATAAAAAT GCCAGAGCAA GTACCACAGG CAATAGCAAA ACAATTTGAA 
GCTATGATTC CAGCTTTTGT TATCTTTCTT TTATCGATGA TTGTTTATTT GATTGCTAAG 
GTAACAACTG GAGGTACCTT TATTGAGATG ATTTATGATA TCATTCAAGT ACCGTTGCAA 
GGCTTAACAG GCTCACTTTA TGGAGCAATT GGGATTGCTT TCTTTATTTC ATTCTTATGG 
TGGTTTGGTG TCCATGGCCA ATCTGTGGTG AATGGTATTG TGACTGCTTT GTTACTATCC 
AATTTAGATG CCAATAAGTC TTTATTAGCA GCAAATCGCT TAACATTAGA TAATGGCGCT 
CACATTGTAA CACAGCAGTT TTTGGATAGT TTCTTGATTT TATCGGGCTC AGGAATAACT 
TTTGGACTAG TTATTGCGAT GCTTTTTGCA GCAAAATCAA AACAATACAA GGCACTTGGG 
AAAGTGGCCG CTTTTCCCGC AATTTTCAAT GTTAACGAGC CAATCGTCTT TGGCTTTCCA 
ATCGTAATGA ATCCTGTGAT GTTTCTGCCT TTTATTTTAG TACCAGTTTT GGCAGCTTTA 
ATTGTTTATG GAGCTATTGC GGTTGGTTTT ATGCAACCAT TCTCAGGTGT TACTTTACCA 
TGGAGTACTC CAGCAATTAT TTCTGGATTC ATGGTAGGTG GTTGGCAAGG TGCACTCGTC 
CAAATAGTCA TTTTAGCTAT CTCAACTGCT GTTTACTTCC CATTCTTTAA AATCCAAGAT 
AATATTACTT ACAAAAATGA ATGTGAAATG GAAAGGGGAT AG

Protein sequence

MSKFDSQKII TPIMKFVNMR GIIALKDGML AILPLTVVGS LFLILGQLPF KGLNQAIANV 
FGPEWTEPFM QVYSGTFAIM GLISCFAIAY AYAKNSSVEP LPAGVLSLSS FFILMKSSYI 
PVKGEAIADA ISKVWFGGQG IIGAIIIGLV VGAIYTWFIQ HHIVIKMPEQ VPQAIAKQFE 
AMIPAFVIFL LSMIVYLIAK VTTGGTFIEM IYDIIQVPLQ GLTGSLYGAI GIAFFISFLW 
WFGVHGQSVV NGIVTALLLS NLDANKSLLA ANRLTLDNGA HIVTQQFLDS FLILSGSGIT 
FGLVIAMLFA AKSKQYKALG KVAAFPAIFN VNEPIVFGFP IVMNPVMFLP FILVPVLAAL 
IVYGAIAVGF MQPFSGVTLP WSTPAIISGF MVGGWQGALV QIVILAISTA VYFPFFKIQD 
NITYKNECEM ERG