Gene STER_1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	STER_1554
Symbol
ID	4437828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus thermophilus LMD-9
Kingdom	Bacteria
Replicon accession	NC_008532
Strand	-
Start bp	1456810
End bp	1458165
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	44%
IMG OID	639677152
Product	anthranilate synthase component I
Protein accession	YP_820902
Protein GI	116628283
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0288667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TTTTACCAGC CGATACCTTA ACACCAATCT TGGCTTATAT GCGTGTTCAA 
GGGGAACACA AGGTTATCCT TGAATCTATT CCTCGTGAGA AGGAAAATGC ACGTTTTTCT 
ATTATTGCCT ACAATCCGGT CTTTGAAGTA ACCTTCAAGG ATGGTGTTCT TTATGAAAAT 
GGTAAGGCGA TTGATCAGGA TCCTTTCGAA TACTTGGACC AAGTAACAGT CAAGGGCATC 
AAGTCTGACC TACCTTTCGC AGGTGGTGCT ATCGGATTTG CAGGTTATGA TATGATTGGT 
CTCTATGAAA ATATCGGGGA GATTCCTGAA GATACGATTG GGACACCTGA TATGCATTTC 
TTCATCTATG AGTCTTATTT GATTTTTGAT CACAAGAAGG AAAAGGTTTA TGTGGTTGAG 
GACAACATCT ACTCTGGCCG TGACAACGAT GCGGTGCGTC AAGCTCTTGG TCAGGTGGTA 
ACGATCCTAC AGACTCAGGC GCCAAACGAG TTTACACCTC AGGCCTTGCA AGCTTTGCAA 
TTTTCGAATC ATATCGAAAA AGAGGTCTTC ATGGATATGG TGGCTAAGGC TAAGAAACTC 
ATTCGTGAGG GAGATATGTT CCAATGTGTG CTTAGTCAAC GCTTTTCAGC GGACTTTGAG 
GGAGATCCTT TGGATTACTA CCGTAACTTG CGCGTGACCA ACCCATCAAA CTACCTTTAT 
TTCTATGATT TCGGAGATTA TCAGGTGATT GGTGCCAGCC CAGAGAGCCT GGTTTCAGTG 
AAAAATGGAG AGGTGTTCAC CAATCCGATT GCTGGAACTC GCCCTCGTGG TGCCAATGAG 
GATGAAGATG CTGCCTTGGC GGATGAACTC TCACATGATG TTAAAGAAAC TGCGGAACAC 
CGTATGTTGG TTGACTTGGG ACGTAATGAT ATTGGTAAGA TTGCCAAAAA TGGTACGGTC 
AAGGTGACCA AGTATATGGA GGTTGAGTAT TTCCGCTATG TGATGCACCT TACTAGTGTG 
GTTAAGGGGC AACTCTTACC GGAGTTGACG TCCCTTGATG CTCTAAAGTC AACCATACCA 
GCTGGAACTG TGTCCGGGGC GCCTAAGATT CGTGCCATGC GTCGTATCTA TGAGCTTGAG 
CAGGAAAAAC GTGGTATTTA CGCGGGAGCT ATCGGTTATT TGTCTGCAAC AGGAGATATG 
GACTTTGCTA TTGCTATCCG TACTATGATT CTCAAAAATC AAAAAGCCTA TGTTCAGGCA 
GGTGCAGGTG TTGTCTATGA CAGTGTTCCT GAAAATGAAT TTTTTGAAAC GATTAATAAG 
GCGAAAGCTA TGACAAGAAT AGGAGATGTC CAATGA

Protein sequence

MRKILPADTL TPILAYMRVQ GEHKVILESI PREKENARFS IIAYNPVFEV TFKDGVLYEN 
GKAIDQDPFE YLDQVTVKGI KSDLPFAGGA IGFAGYDMIG LYENIGEIPE DTIGTPDMHF 
FIYESYLIFD HKKEKVYVVE DNIYSGRDND AVRQALGQVV TILQTQAPNE FTPQALQALQ 
FSNHIEKEVF MDMVAKAKKL IREGDMFQCV LSQRFSADFE GDPLDYYRNL RVTNPSNYLY 
FYDFGDYQVI GASPESLVSV KNGEVFTNPI AGTRPRGANE DEDAALADEL SHDVKETAEH 
RMLVDLGRND IGKIAKNGTV KVTKYMEVEY FRYVMHLTSV VKGQLLPELT SLDALKSTIP 
AGTVSGAPKI RAMRRIYELE QEKRGIYAGA IGYLSATGDM DFAIAIRTMI LKNQKAYVQA 
GAGVVYDSVP ENEFFETINK AKAMTRIGDV Q