Gene STER_0478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	STER_0478
Symbol
ID	4438514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus thermophilus LMD-9
Kingdom	Bacteria
Replicon accession	NC_008532
Strand	+
Start bp	424226
End bp	425725
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	45%
IMG OID	639676199
Product	surface antigen
Protein accession	YP_819956
Protein GI	116627337
COG category	[R] General function prediction only
COG ID	[COG3942] Surface antigen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATCAA AATCTAAAAC TACAAAGGCA CTTCTTTACT CGACTGCAGC ACTTTCGCTT 
TTTGCTGCTA GCCACGTACA TGCCGATGAA ACTTCTCACT GGACAGCACG TTCAGTAGAT 
CAAATCAAGG CAGATATCTC TGTAAATGAT AATCAACAAA CTTACACTGT TCAATATGGT 
GATACTTTAG GTAGTATTGT TGAAGCGATG GGAATCGATA TGAATGTTTT GGCTAATATC 
AAAGAAATTA CAAACATTGA CTTGATTTTC CCTGGAACAG TTTTGACAAC AACATACAAC 
GCCGATAATC AAGCAGTATC AGTTAAAGTT GAAACACCAT CTTCAGAAAC TTCTGACACA 
CCTGTAGTAG CAGAATCTAA CTTGACAACT AACGAAGTGA CTGTAAATGG TCAATCTGTA 
GTAGCATCTG ATTTGTCAGC TCCAGTTGAA ACTGTTAGCT TGACAGCTAC TCAAGCACCT 
GCTAAAGAAG AATCAACACA AGTTGTTTCA GAAGTAACAG AGGCTATCGC ATCAGCATCA 
GATACTCCAG CTTACGCAGA TACTGAACAA CCAGTTGCAG ACGCTATTGA TCATGTTACT 
TCATCAGCTG AAGAAACACT TGCAGAAGAG GAAGCTCCAG CAACTGAAAC ATCTGCACAA 
GCTGAAACAA CTGAAGTAGC AGCAACATCA GAAGCTGCAT CAGAAGCTGC ATCAGATGCG 
CCAGCAGAAC AACTAGCAGC TGCATCAGAG GCACCAGAGA GCTCAGAAGT GCCAGCAGAA 
CAACTAGCAG CTGCATCAGA GGCACCAGAG AGCTCAGAAG CGCCAGCAGA ACAACCAGCA 
GCTGCACCAG AGAGCTCAGA AGCGCCAGCA GAACAACCAG CAGCAACATC AGAAGCTGCA 
TCAGAAGCTC CTGCTAGCGT AGTACCTGTC GCAACATCAG AAGCTGTATC AGAAGCACCA 
GCTGTATCAG AAGTGCCAGC AGAACAACTA GCAGCTGCAT CAGAGGCACC AGAGAGCTCA 
GAAGTGCCAG CAGAACAACC AGCAGCTGCA CCAGAGAGCT CAGAAGCGCC AGCAGAACAA 
CCAGCAGCAA CATCAGAAGC TGCACCAGCT ACATCAGAAG CTCCAGCAGA ACAACTAGCA 
GCGACATCAG AAGCTGCATC AACTCCTAAT ACATATCCAG TTGGACAATG TACTTGGGGT 
GCGAAATCAT TGGCTCCATG GGCTGGTAAT AATTGGGGTA ATGCTAAAGA CTGGATTGCT 
AGTGCGCAAG CAGCTGGTCA CTCAGTAGGT ACAACTCCAG TAGCCGGTGC GATTGCGGTA 
TGGCCAAATG ATGGTGGTGG TTATGGTCAC GTAGCTTATG TTACATCAGC ATCAGGTGTA 
AATTCAATTC AAGTTATGGA ATCGAACTAT GCTGGTAACA TGTTAATCGG TAACTACCGT 
GGTACATTTG ATCCAACATC ATCAGCGCAT GGTGGTTCTG TATATTATAT TTATCCATAA

Protein sequence

MLSKSKTTKA LLYSTAALSL FAASHVHADE TSHWTARSVD QIKADISVND NQQTYTVQYG 
DTLGSIVEAM GIDMNVLANI KEITNIDLIF PGTVLTTTYN ADNQAVSVKV ETPSSETSDT 
PVVAESNLTT NEVTVNGQSV VASDLSAPVE TVSLTATQAP AKEESTQVVS EVTEAIASAS 
DTPAYADTEQ PVADAIDHVT SSAEETLAEE EAPATETSAQ AETTEVAATS EAASEAASDA 
PAEQLAAASE APESSEVPAE QLAAASEAPE SSEAPAEQPA AAPESSEAPA EQPAATSEAA 
SEAPASVVPV ATSEAVSEAP AVSEVPAEQL AAASEAPESS EVPAEQPAAA PESSEAPAEQ 
PAATSEAAPA TSEAPAEQLA ATSEAASTPN TYPVGQCTWG AKSLAPWAGN NWGNAKDWIA 
SAQAAGHSVG TTPVAGAIAV WPNDGGGYGH VAYVTSASGV NSIQVMESNY AGNMLIGNYR 
GTFDPTSSAH GGSVYYIYP