Gene HS_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0474
Symbol	ubiD
ID	4239956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	504994
End bp	506469
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	39%
IMG OID	638104022
Product	3-octaprenyl-4hydroxybenzoate decarboxylase
Protein accession	YP_718685
Protein GI	113460619
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA AAAATCTACG AGATTTTCTT GAATTATTAG AGAAACAAGG TGAGCTCAAA 
AGAATTACAC AGGAAATCGA CCCTTATTTA GAAATGACAG AAATTGCTGA CCGCACTTTG 
CGTGCCGGTG GTCCCGCATT ACTTTTTGAA AATCCAAAAG GCTATGAAAT TCCTGTGCTT 
TGTAATTTAT TTGGTACTCC TAAACGTGTT GCTCTTGGAA TGGGGCAGGA AGATGTTACC 
GCACTGCGTG ATGTAGGGAG ATTACTGGCT TTTCTAAAAG AACCTGAACA ACCAAAAAGT 
TTTAAAGATT TATGGTCAAC TCTTCCTCAA TTTAAACAAG TGCTAAATAT GCCAACGAAA 
GTTTTGAGTA AAGCAGAGTG TCAGCAAATT GTATTCTCTG ATGCTGAAGT TGATTTATAT 
AAATTACCTA TTATGCACTG TTGGAAAGAT GATGTTGCAC CTTTAGTTAC ATGGGGATTA 
ACCATCACTA AAGGACCAAG TAAAAAAAGA CAAAATTTAG GTATTTATCG CCAACAATTA 
ATAGGAAAAA ATAAACTCAT TATGCGTTGG CTATCTCACC GTGGCGGTGC GTTGGATTTT 
CAAGAATGGA AAGAAGCACG CCCTAATCAA CCCTTTCCTA TTTCAGTTGC TTTAGGGGCA 
GATCCTGCCA CTATTCTAGG TGCGGTCACA CCAGTTCCGG ATACCTTATC GGAATATGCT 
TTTGCCGGAT TATTACGTGG TAATAAAACG GAAGTGGTAA AATCAATCAG TAATGATCTT 
GAAATACCTG CAAGTGCGGA GATTATTTTG GAAGGTTATA TTGATCCAAC GGAGACCGCA 
CTTGAAGGTC CATACGGAGA TCATACGGGT TATTACAATG AACAAGAATA TTTTCCTGTA 
TTTACCGTGA CACATCTTAC CATGCGTAAA GATCCGATTT ATCATTCAAC TTACACAGGT 
CGTCCACCGG ATGAGCCTGC AGTTTTGGGT GAAGCACTGA ACGAGGTTTT TATTCCTATT 
TTGCAAAAGC AGTTTCCGGA AATTGTCGAT TTCTATCTTC CTCCGGAAGG ATGCTCTTAC 
CGTCTTGCAG TTGTTACAAT AAAAAAACAA TATGCAGGCC ACGCTAAGAG AGTCATGATG 
GGAGTATGGT CATTTTTACG CCAGTTTATG TACACAAAAT TTGTGATTGT CTGTGATGAC 
GATATAAATG CACGAGATTG GAAAGATGTG ATTTGGGCAA TTACAACACG TAGCGATCCC 
GCCAGAGATT GTACAATTAT AGAAAATACG CCTATTGATT ATCTTGATTT TGCCTCACCG 
ATTGCTGGTC TCGGCTCAAA AATGGGAATA GATGCGACAA ACAAATGGAT TGGAGAAACG 
CAACGTGAAT GGGGAACCCC AATTAAAAAA GCCCCTAATG TAGTTAAACG CATTGATGAT 
ATTTGGGAGA GTCTAAATAT TTTTGCTCCC AAATAA

Protein sequence

MKYKNLRDFL ELLEKQGELK RITQEIDPYL EMTEIADRTL RAGGPALLFE NPKGYEIPVL 
CNLFGTPKRV ALGMGQEDVT ALRDVGRLLA FLKEPEQPKS FKDLWSTLPQ FKQVLNMPTK 
VLSKAECQQI VFSDAEVDLY KLPIMHCWKD DVAPLVTWGL TITKGPSKKR QNLGIYRQQL 
IGKNKLIMRW LSHRGGALDF QEWKEARPNQ PFPISVALGA DPATILGAVT PVPDTLSEYA 
FAGLLRGNKT EVVKSISNDL EIPASAEIIL EGYIDPTETA LEGPYGDHTG YYNEQEYFPV 
FTVTHLTMRK DPIYHSTYTG RPPDEPAVLG EALNEVFIPI LQKQFPEIVD FYLPPEGCSY 
RLAVVTIKKQ YAGHAKRVMM GVWSFLRQFM YTKFVIVCDD DINARDWKDV IWAITTRSDP 
ARDCTIIENT PIDYLDFASP IAGLGSKMGI DATNKWIGET QREWGTPIKK APNVVKRIDD 
IWESLNIFAP K