Gene SAG1943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1943
Symbol
ID	1014753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	1931943
End bp	1932980
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	39%
IMG OID	637317110
Product	hypothetical protein
Protein accession	NP_688931
Protein GI	22538080
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.643032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACAA CATTAAACTA CATTAAAACC CTGACATCAA TCCCTTCACC AACAGGGTTT 
ACCCAAACAA TCATGACCTA TATCATCAAA GAATTGGAAG CGTTTGGCTA CTCACCAATT 
CGCACAAACA AGGGAGGCGT CATGGTTTCT CTAAAAGGAA AAAATGATAC TAAACATCGC 
ATGATAACTG CTCACCTTGA TACACTTGGT GCTATGGTTA GGGCCATCAA ACCAGATGGT 
CGGTTAAAAA TTGACCTTAT TGGTGGATAT ACATACAATG CCATTGAAGG AGAAAACTGT 
ACTATACACC TCTCAAAAAA TGGTAAAGAA ATTTCTGGAA CTGCTCTTAT TCATCAAACT 
AGTGTCCATG TTTACAAAGA CGCTGGAACT GCTGAACGTA ATCAAACAAA TATGGAAATT 
CGTTTAGATG AGAAAGTAAC AACTGCTGAC GAAACACGTG CTTTAGGCAT CCAGGTCGGT 
GATTTCATTT CATTTGATCC GCGTACAATC ATAACAGACA GCGGCTTTAT TAAATCACGT 
TACCTAGATG ACAAGGTATC CGCTGGTATC CTAATGGAAC TTCTTTCTGT TTACAAGAAA 
GAAGACATTC AACTTCCTTA TACTACTCAT TTCTACTTTA GTGCCTTTGA AGAGCTAGGA 
CATGGAGCAA ATTCAAGCAT CCCAAATGAA ACTGTAGAAT ATCTAGCAGT TGATATGGGA 
GCTATGGGAG ACGATCAAGA AACTGACGAA TATACTGTCT CTATCTGTGT TAAAGATGCT 
TCTGGTCCTT ATCATTATGA ATTACGTCAA CATCTTGTTT CTCTAGCTGA AAACAATAAT 
ATTCCTTATA AACTTGATAT TTATCCTTAT TATGGTAGTG ACGCCTCCGC TGCCATGCGT 
GCTGGTGCGG AAGTTAAACA CGCGCTACTT GGTGCAGGTA TTGAATCTAG TCATTCTTAT 
GAACGTACCC ATATCGATTC TATTCAAGCA ACTGAACTCT TAGTGGATGC CTATCTCAAA 
AGCAATATGG TGGACTAA

Protein sequence

METTLNYIKT LTSIPSPTGF TQTIMTYIIK ELEAFGYSPI RTNKGGVMVS LKGKNDTKHR 
MITAHLDTLG AMVRAIKPDG RLKIDLIGGY TYNAIEGENC TIHLSKNGKE ISGTALIHQT 
SVHVYKDAGT AERNQTNMEI RLDEKVTTAD ETRALGIQVG DFISFDPRTI ITDSGFIKSR 
YLDDKVSAGI LMELLSVYKK EDIQLPYTTH FYFSAFEELG HGANSSIPNE TVEYLAVDMG 
AMGDDQETDE YTVSICVKDA SGPYHYELRQ HLVSLAENNN IPYKLDIYPY YGSDASAAMR 
AGAEVKHALL GAGIESSHSY ERTHIDSIQA TELLVDAYLK SNMVD