Gene HS_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1072
Symbol
ID	4240571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1188767
End bp	1190194
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	31%
IMG OID	638104633
Product	hypothetical protein
Protein accession	YP_719284
Protein GI	113461215
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TTAAAGTTAT CTTATTAATC TTATTATTAG GCACTACGAC TCATATTTAT 
GCACAACAAA AGTTTAATTC TATAGATGAG ATTAATAATA TTACTTTAAG TAAATCACAA 
TTATTGTTTG AATTAGATTT ATTGGAACAA CAACTATCCG AGGAATATCA GCATAGATTA 
TATGAACAAT TACATTCTTT GCTCAGAAAT ATAGATTTAC AATTTAAAAC TACAATTGGT 
CGTATTTATG TTGAAAATGA CTATGCATTG CTTTGGGAAG ATAAGCAAGC TGAAAAAATG 
TTTTTACGTG AATATGCCGC AATAGTTGCA AGCGGAGTCT CTGAAAGAGC GGCAAGATTA 
TTGAATGATA TTTATAAAGC ATCTGAAATG GGAGGGTTAG TTTATGATAT GTTGCTGACC 
GACGCATTTT TGGATTATAT GTATTATTCA AAAAATGCAA AAAATTTTGC ACAACAGTGG 
TTCTACTCAG CAAATAGCTA CAAAGCTCAA TTGCCATCAA AACAAGATAT TCAACGATGG 
CTATCATCAA TAAAACATAA TGAAAATTTG ATGTTCATCG AACAATTAGC TCAACATAAT 
GAGCAATATG AGAAAATTAT AACTTACCTG AGTAAATTAA TACCCCAAGA TGACAAGTCA 
ATATTATACA AATTAGCAAT TAATGCTCAG CGTTTAAGGA TTATTCCCGA TTTTAACAAC 
GGTATTTTTG TTAATATTCC AAGTTATCAA TTAAATTATT ATAGAGATGG AAAATTAGTT 
TTAAACTCTA AAGTCATTGT CGGTAAAAAA GCACGTAAAA CACCGGTAAT GTATAGTAAG 
CTAAGTAATA TTGTTGTTAA TCCACCTTGG ATACCTACTC CTCGTTTAAT TAATGAAGAT 
ATCGTGCCAA AGATTAAACT TGATCCGGAT TATGTTGCTC GTAATAGTTA TACCATAAGT 
GATAGCAAGG GGCAGGTTAT AGATCCTTCA TCAATAGATT GGAATACTAT AGGCACTAAT 
TTTCCCTATC GAATCCGCCA AGCTCCGGGA GGAAGTGCAT TAGGAAACTA TAAATTTAAT 
ATGCCCAGTT CAGATGCAAT TTATTTACAC GATACACCCA ATAGAGGATT ATTTAGCAAA 
AAAAATAGAG CATTAAGTTC AGGTTGTGTT CGTGTAGAAA AGTCAGATCA ACTGGCGACA 
ATTTTATTAA CAGAAGCCGG TTGGACAGAA GAACGTAAGC AAAACGTGCT TAATAGTAAA 
AAAAATACTT CGGAGAATAT TCGCTCCGAT AATCCTGTAT ATTTATATTA TGTTACTACT 
TGGGTTGAAA ACGATGTCGT GAAAACATTA CCTGATATTT ATGAGTATGA TCAAGTACCT 
CATTTAACTT ATATTAACTG GAATATTATT AAATGGTATC TAAATTAA

Protein sequence

MRKIKVILLI LLLGTTTHIY AQQKFNSIDE INNITLSKSQ LLFELDLLEQ QLSEEYQHRL 
YEQLHSLLRN IDLQFKTTIG RIYVENDYAL LWEDKQAEKM FLREYAAIVA SGVSERAARL 
LNDIYKASEM GGLVYDMLLT DAFLDYMYYS KNAKNFAQQW FYSANSYKAQ LPSKQDIQRW 
LSSIKHNENL MFIEQLAQHN EQYEKIITYL SKLIPQDDKS ILYKLAINAQ RLRIIPDFNN 
GIFVNIPSYQ LNYYRDGKLV LNSKVIVGKK ARKTPVMYSK LSNIVVNPPW IPTPRLINED 
IVPKIKLDPD YVARNSYTIS DSKGQVIDPS SIDWNTIGTN FPYRIRQAPG GSALGNYKFN 
MPSSDAIYLH DTPNRGLFSK KNRALSSGCV RVEKSDQLAT ILLTEAGWTE ERKQNVLNSK 
KNTSENIRSD NPVYLYYVTT WVENDVVKTL PDIYEYDQVP HLTYINWNII KWYLN