Gene HS_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0404
Symbol	ispG
ID	4239880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	429307
End bp	430413
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	41%
IMG OID	638103947
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_718614
Protein GI	113460550
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCGT TTAAACCAAC TATTAATCGT CGTCAATCGA CAAAAATTTA TGTGGGAAAT 
GTACCGATAG GTGGTGATGC ACCTATTGCC GTACAATCTA TGACCAATAC AAGAACGACT 
GACATAGAAG CAACAGTGGC ACAAATTAAA GCATTGGAGC GTGTCGGTGC TGATATTGTG 
CGTATTTCTG TGCCTACTAT GGATGCGGCA GAGGCGTTCA AATCAATTAA ACAGCAGGTT 
AATATTCCGT TAGTTGCAGA CATCCACTTT GATTATCGTA TTGCTCTTAA GGTGGCGGAA 
TATGGGGTAG ATTGTTTGCG AATTAATCCC GGTAATATTG GGCGTGAAGA TCGTATTCGT 
GCCGTTGTTG ATTGTGCGAA GGACAAAAAT ATCCCTATTC GTATAGGTGT TAATGCAGGA 
TCTTTAGAAA AAGATCTACA GGAAAAATAT GGCGAACCTA CACCAGAGGC TTTGCTGGAA 
AGTGCGTTAC GTCATGTGGA AATTTTAGAT CGTTTGAACT TCGATCAGTT TAAGGTTAGT 
GTGAAAGCCT CGGATGTCTT TCTTGCGGTA GAAAGCTATC GCTTATTGGC AAAAGCAATT 
AAACAACCAC TGCATTTAGG AATTACCGAA GCCGGTGGAG CACGTGCCGG TGCGGTAAAA 
AGTGCGGTCG GTTTGGGGAT GCTTTTAGCG GAAGGCATTG GCGATACATT ACGCGTTTCT 
TTAGCAGCCG ATCCTGTCGA AGAAATCAAA GTAGGTTTTG ATATTTTAAA ATCTCTGCGT 
ATTCGTTCTC ATGGCATTAA TTTTATTGCC TGTCCGACTT GTTCTCGTCA GGAATTTGAT 
GTAATCGGTA CTGTCAATGC ACTGGAGCAA CGTTTGGAAG ATATTGTTAC ACCAATGGAT 
GTATCCATTA TCGGTTGTGT GGTGAACGGA CCAGGCGAAG CGTTAATTTC AGATCTTGGA 
GTAACAGGCG GTAATAAAAA GAGCGGTTAT TATTTAGATG GAAAACGTCA AAAAGAACGC 
TTTGATAATG AGGATTTAAT TAATCAGTTA GAGGCAAAAA TTCGTGCGAA AGTCGCACAG 
CAAGATCCAA AAAACAGAAT TATCTAA

Protein sequence

MSSFKPTINR RQSTKIYVGN VPIGGDAPIA VQSMTNTRTT DIEATVAQIK ALERVGADIV 
RISVPTMDAA EAFKSIKQQV NIPLVADIHF DYRIALKVAE YGVDCLRINP GNIGREDRIR 
AVVDCAKDKN IPIRIGVNAG SLEKDLQEKY GEPTPEALLE SALRHVEILD RLNFDQFKVS 
VKASDVFLAV ESYRLLAKAI KQPLHLGITE AGGARAGAVK SAVGLGMLLA EGIGDTLRVS 
LAADPVEEIK VGFDILKSLR IRSHGINFIA CPTCSRQEFD VIGTVNALEQ RLEDIVTPMD 
VSIIGCVVNG PGEALISDLG VTGGNKKSGY YLDGKRQKER FDNEDLINQL EAKIRAKVAQ 
QDPKNRII