Gene HS_0671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0671
Symbol	tyrA
ID	4240159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	718191
End bp	719315
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	35%
IMG OID	638104223
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_718883
Protein GI	113460816
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.106766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGTTT TAAAAAATTT AAGAACAGAA ATTGATTGCT TAGATCGTGA ATTACTACAC 
CTTTTTTCTC AACGCTTAGA ATTAGTCAGA AAAGTAGGCA AAGTGAAACA TCAATATGGA 
TTACCGATTT ATGTACCTGA ACGTGAAAAT GAAATGTTAC AGGCTCGTCG CAATGAAGCG 
GAAAAGTTAG GTGTTTCACC GGATTTAATT GAAGATGTTT TGCGTCGTTT GATGCGGGAA 
TCTTATACTA GAGAAAATCA ATACGGTTTT AAAACAGCAA ATCCTGAAAT AAAAAAAATC 
GTCATTGTTG GAGGAAAGGG AAAATTAGGG GCATTATTTG CTCGTTATTT GTCTTCTTCT 
GGTTATCAAA TTGCTGTCTT AGAGAAACAG GATTGGCAAA GTGCGGATAA AATTTTACAA 
AATGCAAATG TAGTTATTGT TTGTGTCCCA ATTGCACAAA CTTTAAATGT GATTGACCGT 
CTGAAGCCTT ATCTAACCGA AAATATGCTA TTAACAGATT TAACCTCAGT CAAACGTCAA 
CCGTTGGAAA AAATGTTACA AGTGCATCAA GGTGCGGTAT TGGGATTACA TCCAATGTTT 
GGTCCGGATA TTACCAATAT GGCAAAGCAA GTTGTAGTAC GTTGTGACGG TCGCTACCCT 
GAAAAATACC AATGGTTTTT GGAACAAATT CAAATGTGGG GAGCGAAAAT TTATCAAGTT 
GATGCAACCG AACATGATAA AAGTATGACG TATGTACAAG CCTTACGTCA TTTTTCAACC 
TTTGCAAATG GTTTGCATTT ATCAAAACAA CCTATTGAGT TGGCACAATT GCTTGCCCTA 
TCTTCACCCA TTTATCGTCT TGAATTAGCC ATGATCGGAC GTTTATTTGC TCAAGATGCG 
GAACTTTATG CAGATATTAT TATGGACAAA TCGGAGAATT TGGAAGTGAT TAAGAGTCTA 
AAACAAAGCT ATGAAGAAAG TCTAAATTTC TTTGAACATA ATAATAAGCA GGGATTTATT 
GACTGTTTTA ATCAAGTGCG GGAATGGTTT GGTGAGTATT CAGAGCAATT TTTGAAAGAA 
AGTCGGCAAT TATTACAACA GGCAAATGAT TACAAAAGTA TTTGA

Protein sequence

MDVLKNLRTE IDCLDRELLH LFSQRLELVR KVGKVKHQYG LPIYVPEREN EMLQARRNEA 
EKLGVSPDLI EDVLRRLMRE SYTRENQYGF KTANPEIKKI VIVGGKGKLG ALFARYLSSS 
GYQIAVLEKQ DWQSADKILQ NANVVIVCVP IAQTLNVIDR LKPYLTENML LTDLTSVKRQ 
PLEKMLQVHQ GAVLGLHPMF GPDITNMAKQ VVVRCDGRYP EKYQWFLEQI QMWGAKIYQV 
DATEHDKSMT YVQALRHFST FANGLHLSKQ PIELAQLLAL SSPIYRLELA MIGRLFAQDA 
ELYADIIMDK SENLEVIKSL KQSYEESLNF FEHNNKQGFI DCFNQVREWF GEYSEQFLKE 
SRQLLQQAND YKSI