Gene STER_0809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	STER_0809
Symbol
ID	4438157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus thermophilus LMD-9
Kingdom	Bacteria
Replicon accession	NC_008532
Strand	-
Start bp	743309
End bp	745027
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	38%
IMG OID	639676498
Product	para-aminobenzoate synthetase component I
Protein accession	YP_820252
Protein GI	116627633
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase [COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATAAGA AAACCGTTAT TGATTTTAAA GAACTTGGCG TCAGACAAAT CTTCACTCAC 
GCCACAAAAG AGATAAAAAC CAAAGACATT AAGGAAGTTA AATCACTTAT AAATCAAATA 
GAAGCCTATC AAGAAAAAGG CTATTTTGCT GTAGGCTATG TAGCCTATGA AGCTTCTCAG 
GCCTTTGAAC CTAAATTTCA AATTTTTGAT AGCCCATTAA TGTCAGAGTA TCTTCTCTAT 
TTTACTATTC ACGATACTGT TCAAACAGAG TCTATCCCTC TTGCTTATGA GCCTGTTCCC 
TTACCAGAAT CTTGGCAAGA ACTAACTTCT GCAGAGGAAT ACAAGGCTGC TATTGAGCAT 
ATACACCACC ATATTCGTCA AGGAAACACC TACCAGGTCA ATTTTACCGT CCAACTTCAA 
CAGAACATAA CAGCTGATCC ATTTGCCATC TACAACCGAT TGGTTGTTGA GCAAAATGCA 
CATTACAATG CCTTTATTCA ACATGATGAT GTCTCCATCA TTTCCATAAG TCCTGAACTC 
TTCTTTAAAA AAGATGGTGA TATATTGACC ACACGTCCTA TGAAAGGGAC AACAAATCGT 
GGCTTGACAA CTGAAACTGA CCTTAAACAA GCACAATGGC TTGCTCATGA TCAGAAAAAT 
CGCTCTGAAA ATATGATGAT TGTAGATCTT CTTAGAAATG ACATGAATCG TATTTCAAAA 
ATAGGGAGTG AAAATGTAAA AAGACTTTGC CAGGTTGAAC AATACTCTAC TGTTTGGCAA 
ATGACTTCAA CTATTGAGAC GCAACTCCTA CCAAACAGTC GTTTGGATGA CATCTTCCAA 
GCCCTTTTTC CTTGTGGATC TATTACAGGA GCACCAAAAA TAGCTACTAT GGCAATTATT 
AAAAACGTCG AAAAACAAGC TCGAGGCGTC TATTGTGGAG CCATTGGTAT CTTGCTACCT 
AATGGACCAA CTATTTTCAA CGTAGCCATC CGAACACTTC AAATGCAGGG AAACAATGCT 
ATATATGGAG TAGGCGGTGG AATCACCTGG GACAGCAAAT GGGAAGCTGA ATATGAAGAA 
ACAAGGCAAA AATCAGCTAT TCTATACCGT CAAAATCCTA GATTTGATCT TATCTCAACT 
GGACGGATTC ATCAAGGTAA ACTACTCCAT CTTAAAGAAC ATCTCAATCG TCTACAAGAG 
TCCAGTCGCT ATTTTGCTTA TCCTTTCAAT AAAAAAGAAG TTCAAAATCA AGTCGAAGAT 
TTGTGTCAGT CCCTTGATTT TGACACAGAC TACCGTCTTA AATTGTCCCT TGCAAAAGAT 
GGTAAACTTA CTTTTGAACA TGCTCAATTA ACAGAATTAG ACGATGATTT TTGTCAAGCA 
AGATTAGTTA AGCAAACACA TCCTTTGAAT AACCCCTATA CCTACTTTAA AACAAGTTAT 
CGACCACACA TTAGTCTAGG ACCTCATGAG CAAATCTACT ATAATCAAAA GAAAGAACTT 
TTAGAAACTT CTATCGGTAA CCTCGTTCTT AAAATCAAGG ACCAACTCTA CACTCCACCT 
GTTCACCTCG GTCTTTTAAA CGGTATTTAC AGACAAAGCC TCATTGCTAA TAATCAGGTC 
ACAGAGAAAG TTTTGACTCT GGAAGATTTA AAACAGGCTC AAGCCATCTA TGGCTGTAAT 
GCTGTGAGAG GGTTGTATGA ATTGAGGGTA GATTTCTAA

Protein sequence

MHKKTVIDFK ELGVRQIFTH ATKEIKTKDI KEVKSLINQI EAYQEKGYFA VGYVAYEASQ 
AFEPKFQIFD SPLMSEYLLY FTIHDTVQTE SIPLAYEPVP LPESWQELTS AEEYKAAIEH 
IHHHIRQGNT YQVNFTVQLQ QNITADPFAI YNRLVVEQNA HYNAFIQHDD VSIISISPEL 
FFKKDGDILT TRPMKGTTNR GLTTETDLKQ AQWLAHDQKN RSENMMIVDL LRNDMNRISK 
IGSENVKRLC QVEQYSTVWQ MTSTIETQLL PNSRLDDIFQ ALFPCGSITG APKIATMAII 
KNVEKQARGV YCGAIGILLP NGPTIFNVAI RTLQMQGNNA IYGVGGGITW DSKWEAEYEE 
TRQKSAILYR QNPRFDLIST GRIHQGKLLH LKEHLNRLQE SSRYFAYPFN KKEVQNQVED 
LCQSLDFDTD YRLKLSLAKD GKLTFEHAQL TELDDDFCQA RLVKQTHPLN NPYTYFKTSY 
RPHISLGPHE QIYYNQKKEL LETSIGNLVL KIKDQLYTPP VHLGLLNGIY RQSLIANNQV 
TEKVLTLEDL KQAQAIYGCN AVRGLYELRV DF