Gene HS_0342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0342
Symbol	ilvD
ID	4239816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	344205
End bp	346040
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	43%
IMG OID	638103883
Product	dihydroxy-acid dehydratase
Protein accession	YP_718550
Protein GI	113460488
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAAAC TACGTTCAGC GACCAGTACA CAAGGTCGCA ATATGGCAGG TGCACGTGCT 
TTATGGCGGG CAACAGGAAT GAAAGAAAAT GATTTCGGTA AACCGATTAT TGCGGTTGTG 
AACTCATTTA CTCAATTTGT ACCTGGACAT GTTCACTTAA AAGATATGGG GCAACTAGTT 
GCTACTGAAA TTGAAAAATT TGGTGGGGTA GCAAAAGAGT TTAATACCAT CGCTGTAGAT 
GATGGAATTG CTATGGGGCA TGGAGGTATG CTCTATTCTT TACCGAGCCG AGATTTAATT 
GCCGATAGTG TTGAATATAT GGTTAACGCT CACTGTGCTG ATGCGATGGT TTGTATTTCT 
AACTGTGATA AGATCACACC GGGAATGTTA ATGGCTGCAT TGCGTTTGAA TATTCCAACA 
GTCTTTGTTT CAGGTGGCCC AATGGAAGCG GGTAAAACCA AATTATCCGA TCAAATCATT 
AAATTAGACT TAGTGGATGC TATGATTCAA GGTGCAAATC CGAATGTTTC AGATGATGTC 
AGCGAACAAA TTGAGCGTTC TGCTTGTCCA ACTTGTGGCT CTTGTTCAGG TATGTTTACC 
GCCAATTCAA TGAATTGTTT AACCGAAGCA CTGGGCTTGA GCTTACCGGG AAACGGCTCA 
TGTTTGGCTA CTCATGCCGA CCGCAAACAA CTTTTCTTAG CGGCAGGAAA ACAGATTGTT 
GAACTGTGCA AACGTTATTA TGAACAAGAT GATACATCTG TTTTACCTCG CTCAATTGCC 
ACAAAAGAAG CCTTTGATAA CGCTATGAGT CTTGATATCG CTATGGGTGG TTCGACCAAT 
ACTGTTTTGC ATTTATTAGC TGCTGCACAG GAAGCGGAAG TCAATTTCAC TATGGCGGAT 
ATTGATCGCC TTTCTCGGGT AGTACCGTGC CTGAGCAAAG TTGCACCAAA TACCCAAAAG 
TATCATATGG AAGATGTGCA TCGTGCTGGC GGTATTATGG CAATTTTAGG TGAATTAGAT 
CGTGCCGGCT TGTTGAATAG CCAAACTCGT ACAATTTTGG GTATGAGCAT AGGCGAACAA 
ATTGCAAAAT ATGACATCAA ACTCACTCAA GATAAAGCCA TACATAAATT TTTCCGTGCA 
GGACCAGCAG GGATTCGCAC TACTCAAGCT TTCTTGCAAG ATTGTCGTTG GGATACGGTT 
GATGATGATC GTGAAAATGG CTGTATTCGC AGTAAAGAAT TTGCGTACAG CCAAGATGGT 
GGGTTAGCTA TGTTGTCAGG CAATATTGCT TTAGATGGCT GTATAGTCAA AACTGCTGGA 
GTAGATGAAA GCATTTTAAA GTTCAGCGGT AAAGCCATTG TATTTGAAAG TCAAGAAGAT 
GCTGTATCAG GCATTTTGGG GGGTAAAGTA CAAGCCGGAC ATGTTGTGGT GATTCGGTAT 
GAAGGACCAA AAGGCGGACC TGGTATGCAA GAAATGCTTT ATCCAACCAG TTATCTCAAA 
TCTATGGGCT TAGGTAAAGC TTGTGCCTTA CTTACAGATG GTCGTTTCTC CGGTGGTACA 
TCGGGACTGT CTATCGGACA CTGCTCACCG GAGGCGGCGG CAGGCGGTTT AATTGGTGTA 
GTGAAAGATG GTGATATTAT TGAGATTGAT ATTCCAAATC GTCGCATCGA ATTGATGGTA 
TCCGAAGAAG AACTTGCTGA GCGTCGAGCA GAGCAAGATA AACTTGGCTG GAAACCAGCT 
AATCGCCAGA GAGAAGTTTC CTTTGCCCTA AAAGTTTACG GATATTTCGC AACATCTGCG 
GACAAGGGTG CAGTACGAGA TAAAACGAAG ATATAA

Protein sequence

MPKLRSATST QGRNMAGARA LWRATGMKEN DFGKPIIAVV NSFTQFVPGH VHLKDMGQLV 
ATEIEKFGGV AKEFNTIAVD DGIAMGHGGM LYSLPSRDLI ADSVEYMVNA HCADAMVCIS 
NCDKITPGML MAALRLNIPT VFVSGGPMEA GKTKLSDQII KLDLVDAMIQ GANPNVSDDV 
SEQIERSACP TCGSCSGMFT ANSMNCLTEA LGLSLPGNGS CLATHADRKQ LFLAAGKQIV 
ELCKRYYEQD DTSVLPRSIA TKEAFDNAMS LDIAMGGSTN TVLHLLAAAQ EAEVNFTMAD 
IDRLSRVVPC LSKVAPNTQK YHMEDVHRAG GIMAILGELD RAGLLNSQTR TILGMSIGEQ 
IAKYDIKLTQ DKAIHKFFRA GPAGIRTTQA FLQDCRWDTV DDDRENGCIR SKEFAYSQDG 
GLAMLSGNIA LDGCIVKTAG VDESILKFSG KAIVFESQED AVSGILGGKV QAGHVVVIRY 
EGPKGGPGMQ EMLYPTSYLK SMGLGKACAL LTDGRFSGGT SGLSIGHCSP EAAAGGLIGV 
VKDGDIIEID IPNRRIELMV SEEELAERRA EQDKLGWKPA NRQREVSFAL KVYGYFATSA 
DKGAVRDKTK I