Gene SAG2061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG2061
Symbol
ID	1014872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	2041160
End bp	2042365
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	32%
IMG OID	637317227
Product	glycosyl transferase family protein
Protein accession	NP_689047
Protein GI	22538196
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAG CAGTTGCACT TGCAGTTGAT TCAAACTACT TGGATAAAGC CTTAGTAACA 
ATAAAGTCTA TTTGTGTTTA TAATAGAAAT ATAACTTTTT ATTTATTCAA TCAAGATACC 
CCAGTTGAAT GGGTACGTAA TATAAACAGG AAACTAGAGC CTCTAGGATC AAAACTGATT 
AATGTTAAAA TATATAACTA TGATATTGCT CATCTAACGA CTTTTCTAAC TGTTAGTACA 
TGGTTTAGAT TATTTTTAGC AGATTATATA CCTAGTTCAC GTGTACTTTA TTTAGATTCA 
GATATTATCG TTAACACTAA TCTTGATTAC TTATTTGAAC TAGATTTTAA AGGTTATTAC 
TTAGCAGCCG TCAAAGATCC CCATAAAAAT GAAGAAGGAG GGTTTAATGC TGGCATGCTT 
TTAGCTAATC TAGAACTATG GCGGGAAGAT GGGCTCACTA AAACATTACT AAAAACAGCT 
GAAGAACTCC ACCGAGTTGT CAAAACAGGG GATCAAAGTA TCTTGAACAT TGTTTGCCAT 
AATCGTTGGT TATCTCTGAA CAAAACATGG AACTTTCAAA CTTATGATGT CGTTAGCCGC 
TATAATCATC GATCTTATTT ATATCTAAAC ATAGAAAATA GAACTCCTAA TATTATACAT 
TTTTTAACTA GTGACAAACC TTGGAATGAA AATAGCGTTG CAAGGTTTAG AGAACTATGG 
TGGTATTACT TCCAACTTGA TTTTTGCCAA TTAACCGGCA AGCAAAGAAA AGTGATTTCT 
TACGAAAAGT CCATGGAATT GCTTTCTGTT TCAGATATTC ATCTTTTCAC TCTTACATCT 
TCCGATAATT TAGAACACAT TGAATCGCTA ATTTGTAGAT GTCCTACTGT TCAATTCCAT 
ATTGGTGCCT ACACAACAGT GTCAAATAAA CTTAGCAAAC TAGAACAATA TCCAAATGTC 
CTAGTTTACC CTGAATTAAT TGAGGCAAGA ATTGAAAAAT TAATAACATT AGCCACTGCA 
TACCTTGATA TTAATCATGG TCCAGAAGTA GGTAATATTT TACAAAGAGT TCATTTGAAA 
CAAAAGCCAA TTTATTCTTT CAACAACACG TCTCATCAAG AGAATATAAC CAAACATATC 
GTTAATCATA ATTCTATTGA TAATATGGTT GTTTTAATTA ACGAATTAAA CCTAAATCAA 
TTATAA

Protein sequence

MEKAVALAVD SNYLDKALVT IKSICVYNRN ITFYLFNQDT PVEWVRNINR KLEPLGSKLI 
NVKIYNYDIA HLTTFLTVST WFRLFLADYI PSSRVLYLDS DIIVNTNLDY LFELDFKGYY 
LAAVKDPHKN EEGGFNAGML LANLELWRED GLTKTLLKTA EELHRVVKTG DQSILNIVCH 
NRWLSLNKTW NFQTYDVVSR YNHRSYLYLN IENRTPNIIH FLTSDKPWNE NSVARFRELW 
WYYFQLDFCQ LTGKQRKVIS YEKSMELLSV SDIHLFTLTS SDNLEHIESL ICRCPTVQFH 
IGAYTTVSNK LSKLEQYPNV LVYPELIEAR IEKLITLATA YLDINHGPEV GNILQRVHLK 
QKPIYSFNNT SHQENITKHI VNHNSIDNMV VLINELNLNQ L