Gene ECH74115_2541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2541
Symbol	pabB
ID	6968124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2402928
End bp	2404289
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	51%
IMG OID	643386409
Product	aminodeoxychorismate synthase
Protein accession	YP_002270891
Protein GI	209399624
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.169515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGT TATCTCCCGC TGTGATTACT TTACCCTGGC GTCAGGACGC CGCTGAATTT 
TATTTCTCCC GCTTAAGCCA CCTGCCGTGG GCGATGCTTT TACACTCCGG CTATGCCGAT 
CATCCGTATA GCCGCTTTGA TATTGTGGTC GCCGATCCGA TTTGCACTTT AACCACTTTA 
GGTAAAGAAA CCGTTGTTAG TGAAAGCGAA AAACGCACAA CGACCACTGA TGACCCGCTA 
CAGGTGCTCC AGCAGGTGCT GGATCGCGCA GACATTCGCC CAACGCATAA CGAAGATTTG 
CCATTTCAGG GCGGCGCACT GGGGTTGTTT GGCTACGATC TGGGCCGCCG TTTTGAGTCA 
CTGCCAGAAA TTGCGGAACA AGATATCGTT CTGCCGGATA TGGCAGTGGG TATCTACGAT 
TGGGCGCTCA TTGTCGACCA CCAGCGTCAT ACAGTTTCTT TGCTGAGTCA TAATGATGTC 
AATGCCCGTC GGGCCTGGCT GGAAAGCCAG CAATTCTCAC CGCAGGAAGA TTTCACGCTC 
ACTTCCGACT GGCAATCCAA TATGACCCGC GAGCAGTACG GCGAAAAATT TCGCCGGGTA 
CAGGAATATC TGCACAGCGG TGATTGCTAT CAGGTGAATC TCGCCCAGCG TTTTCATGCG 
ACCTATTCTG GCGATGAATG GCAGGCATTC CTTCAGCTTA ATCAGGCCAA CCGCGCGCCA 
TTTAGCGCTT TTTTACGTCT TGAACAGGGT GCAATTTTAA GCCTTTCGCC AGAGCGGTTT 
ATTCTTTGTG ATAATAGTGA AATCCAGACC CGCCCGATTA AAGGCACGCT ACCACGCCTG 
CCCGCTCCTC AGGAAGATAG CAAACAAGCA GAAAAACTGG CGAACTCAGC GAAAGATCGT 
GCCGAAAATC TGATGATTGT CGATTTAATG CGTAATGATA TCGGTCGTGT TGCCGTAGCA 
GGTTCGGTAA AAGTACCAGA GCTGTTCGTG GTGGAACCCT TCCCTGCCGT GCATCATCTG 
GTCAGCACCA TAACGGCGCA ACTACCAGAA CAGTTACACG CCAGCGATCT GCTGCGCGCA 
GCTTTTCCTG GTGGCTCAAT AACCGGGGCT CCGAAAGTAC GGGCTATGGA AATTATCGAC 
GAACTGGAAC CGCAGCGACG TAATGCCTGG TGCGGCAGCA TTGGCTATTT GAGCTTTTGC 
GGCAACATGG ATACCAGCAT TACTATCCGC ACGCTGACTG CCATTAACGG ACAAATATAC 
TGCTCTGCGG GAGGTGGAAT TGTCGCCGAT AGCCAGGAAG AAGCGGAATA TCAGGAAACT 
TTTGATAAAG TTAATAAGAT ATTACGCCAA CTGGAGAAGT AA

Protein sequence

MKTLSPAVIT LPWRQDAAEF YFSRLSHLPW AMLLHSGYAD HPYSRFDIVV ADPICTLTTL 
GKETVVSESE KRTTTTDDPL QVLQQVLDRA DIRPTHNEDL PFQGGALGLF GYDLGRRFES 
LPEIAEQDIV LPDMAVGIYD WALIVDHQRH TVSLLSHNDV NARRAWLESQ QFSPQEDFTL 
TSDWQSNMTR EQYGEKFRRV QEYLHSGDCY QVNLAQRFHA TYSGDEWQAF LQLNQANRAP 
FSAFLRLEQG AILSLSPERF ILCDNSEIQT RPIKGTLPRL PAPQEDSKQA EKLANSAKDR 
AENLMIVDLM RNDIGRVAVA GSVKVPELFV VEPFPAVHHL VSTITAQLPE QLHASDLLRA 
AFPGGSITGA PKVRAMEIID ELEPQRRNAW CGSIGYLSFC GNMDTSITIR TLTAINGQIY 
CSAGGGIVAD SQEEAEYQET FDKVNKILRQ LEK