Gene HS_0365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0365
Symbol	pheA
ID	4239841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	373254
End bp	374411
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	35%
IMG OID	638103908
Product	chorismate mutase / prephenate dehydratase
Protein accession	YP_718575
Protein GI	113460511
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01797] chorismate mutase domain of proteobacterial P-protein, clade 1

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0036667
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTAG ATTTAAGCGA AATTCGTCAA CAAATTACAC AAATTGACCG CAGTTTATTA 
AAGTTGCTTT CGGAGCGTCA TCGTTTAGCA TTTGATGTCG TACGTAGTAA AGAAATCTCG 
CAGAAAGCAT TACGTGATGT TGAACGTGAG CAGCAATTAT TGAAAGAGTT GGTTCAATTT 
GCGGAAAATG AAAATTATCA ATTGGAACCA CAATATATTA CTCAGATTTT CCAAAAAATT 
ATCGAAGATT CCGTGTTGAC TCAGCAAGTA TATTTGCAAA AGAAATTGAA TGAGCAAAGA 
GAGAAGAATA TTCATATTGC TTTTTTAGGT AAAAGAGGTT CTTACTCGCA TTTAGCCGCC 
AGAAATTATG CAACTCGTTA TCAGGAGCAA CTAATTGAGC TAAGTTGTGC GTCTTTTGAT 
GAAGTATTTT CCTCTGTGCA AAATGAGGAG GCAAGTTATG GCATTTTACC GTTGGAGAAT 
ACAACCTCAG GAGCGATTAA TGAAGTGTAT GATTTATTAC AGCATACAGA TCTTTCTTTA 
GTAGGTGAAT TGGCTTATCC AATTAAACAT TGTGTTCTGG TAAATGCTCA AGATGATTTG 
GATAAGATTG ATACTTTATA CAGTCATCCT CAAGTGATTC AGCAATGTAG CCAATTTATT 
CGTACTTTAG CGCGAGTTCA TATTGAATAT TGTGAAAGCA GCTCACATGC AATGCAACTT 
GTTGCCAGCT TAAATAAACC TAATATTGCA GCTTTAGGCA ATGAAGATGG TGGGAATTTA 
TATGGTTTAA AAGTATTAAA GTCCGGTATA GCAAACCAAG AAAACAATAT TACGAGATTT 
ATTGTTCTTG CTAAGAATCC GATTGCAGTA TCACCGCAAA TTCATACAAA GACATTATTA 
TTAATGAGTA CTGCACAAAA AGCGGGGGCA TTAGTTGATG CTTTATTGGT CTTCAAAAAA 
TATAACATCA ATATGACGAA GTTAGAGTCA CGTCCAATTT ATGGTAAACC ATGGGAAGAG 
ATGTTTTATT TAGAAATTGA GGCTAATATT AATAACCCTA TCGCTCAGCA AGCTTTTACT 
GAACTAAAAG CATTCAGTAA CTACTTGAAA ATCTTAGGTT GTTATCCAAG TGAAATTGTG 
AAACCTGCCG AAGTCTAA

Protein sequence

MSLDLSEIRQ QITQIDRSLL KLLSERHRLA FDVVRSKEIS QKALRDVERE QQLLKELVQF 
AENENYQLEP QYITQIFQKI IEDSVLTQQV YLQKKLNEQR EKNIHIAFLG KRGSYSHLAA 
RNYATRYQEQ LIELSCASFD EVFSSVQNEE ASYGILPLEN TTSGAINEVY DLLQHTDLSL 
VGELAYPIKH CVLVNAQDDL DKIDTLYSHP QVIQQCSQFI RTLARVHIEY CESSSHAMQL 
VASLNKPNIA ALGNEDGGNL YGLKVLKSGI ANQENNITRF IVLAKNPIAV SPQIHTKTLL 
LMSTAQKAGA LVDALLVFKK YNINMTKLES RPIYGKPWEE MFYLEIEANI NNPIAQQAFT 
ELKAFSNYLK ILGCYPSEIV KPAEV