Gene STER_0678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	STER_0678
Symbol
ID	4437261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus thermophilus LMD-9
Kingdom	Bacteria
Replicon accession	NC_008532
Strand	-
Start bp	614647
End bp	615732
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	40%
IMG OID	639676379
Product	dipeptidase
Protein accession	YP_820133
Protein GI	116627514
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAAAC TTGATCGCAT TCGTCATTTT TTAAATGAAA ATAAATCAGG GCTAGCTATT 
GTTTCAGATC CTGTAACTGT CAATTATCTT ACTGGTTTTG ATTGTGACCC ACATGAACGC 
CAAATGTTCC TCTTCGTCTA CGAAAATCGT GAGCCTGCCC TCTTTGTTCC TGCTCTTGAG 
GTTGCACGTG CCTCTTCTGT TCTCGATTTC CCAGTCTTCG GTTATGTGGA CTCTGAAAAT 
CCATGGCAAA AAATCAAAGC TGGTCTAGCA AGTACAGACA TCCCTATTAT TTATGCAGAG 
TTTGATAATC TCAATGTAAC TAAATTCCAA GGATTGCAAA CGGTCTTTGA AGGTCGCTTC 
GAGAACCTGA CACCATTCAT CCACAAAATG CGAGTTATCA AGTCAGCTGA TGAAATTCAA 
AAAATGATTG TTGCCGGTGA TTATGCTGAT AAAGCTGTCA ATATCGGTTT TGACAATATA 
TCTCTCGACG TTACTGAAAC AGACATCATT GCTCAAATCG AATTTGGCAT GAAGAAAATC 
GGTATCAATC AAATGTCCTT TGAAACTATG GTTCTCACAG GCAACAATGC CGCAAACCCA 
CATGGTATTC CAGGAACTAA CCGCATTGAA AATGATAGCC TCCTCCTCTT CGACTTGGGT 
GTTGTTAGTC AAGGCTATGT TTCAGATATG ACACGTACCG TAGCTGTTGG TCAACCTGAC 
CAATTCAAGA AAGATATCTA CAATATCTGT TTGGAAGCTC AACTCACTGC CCTTGATTTT 
ATCAAACCAG GCGTAACAGC CAGTGAAGTT GATGCTGCAG CTCGTAATGT TATTGAAAAG 
GCTGGTTACG GCAAATACTT CAACCACCGT TTGGGACATG GTATTGGTAT GGATGTCCAT 
GAGTTTCCTT CAATCATGGA AGGAAATGAC TTGATTATCG AAGAAGGTAT GTGCTTCTCT 
GTTGAACCAG GAATTTACAT TCCTGAAAAA GTTGGTGTTC GTATCGAAGA CTGTGGCTAT 
GTTACAAAAG ATGGCTTCGA AGTCTTTACA CACACACCAA AAGAACTTCT CTATTTTGAT 
GTTTAA

Protein sequence

MSKLDRIRHF LNENKSGLAI VSDPVTVNYL TGFDCDPHER QMFLFVYENR EPALFVPALE 
VARASSVLDF PVFGYVDSEN PWQKIKAGLA STDIPIIYAE FDNLNVTKFQ GLQTVFEGRF 
ENLTPFIHKM RVIKSADEIQ KMIVAGDYAD KAVNIGFDNI SLDVTETDII AQIEFGMKKI 
GINQMSFETM VLTGNNAANP HGIPGTNRIE NDSLLLFDLG VVSQGYVSDM TRTVAVGQPD 
QFKKDIYNIC LEAQLTALDF IKPGVTASEV DAAARNVIEK AGYGKYFNHR LGHGIGMDVH 
EFPSIMEGND LIIEEGMCFS VEPGIYIPEK VGVRIEDCGY VTKDGFEVFT HTPKELLYFD 
V