Gene HS_1642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1642
Symbol
ID	4241169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1873643
End bp	1874821
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	35%
IMG OID	638105228
Product	hypothetical protein
Protein accession	YP_719847
Protein GI	113461778
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAC CATTAAATTT TGTGATGATT TCTCCACATT TTCCTGCAAA CTTTGAAACT 
TTTGCCGTTC GTTTAAAGGA GTGTGGTTTT AATACATTAG GTATTGCAGA CACACCTTAT 
GAACAGTTAA GTGAAAACTT GCGTAATTCC TTAACGGAAT ATTATCGTGT TGATAATATG 
GAAGACTACG AGCAAGTCTA TCGTGCTGTT GGTTATTTTG CACATAAGTA TGGTCGAATT 
GATCGTATTG AATCTCATAA TGAATACTGG CTTGAGCTTG ATGCAAAATT ACGTACGGAT 
TTTAATGTTC CCGGGTATAA GAACGATGAT ATGTTGGCAA TCAAAACCAA AGCACAAATG 
AAAGAAATTT TTCGTCAAGC AGGTCTGAAA GTTGCTCAGG GAAAAGTATT TAACTCTGAT 
GATGAAGCAC GTAAGTTAGC TAAAAAATTG AAGTTTCCTG TGATTATTAA GCCAAATTCA 
GGAGTGGGTG CAAGCGATAC TTATAAAATT AAGTCGGTAC AAGAATTAGA GGACTTTTTT 
TCTTATAAAA ATGCACACGT TGAATACATC ATGGAAGAAT TTATTGATGG GGACATTATT 
ACCTTTGATG GTTTAACCGA TAAAGAGGGC AATATTGTGT TCTATTCCGG TCTTGAATAT 
TCCGAGTGCG TATTGGATAC CGTAGAAAAT GATAACGATA TGTTCTATTA CGTTCCTCGA 
GAAATTTCAA CCGACTTAAT TAAATTAGGA CAAAAATGTG TTGATGCTTT CAACGTTCGT 
GAGCGTTTCT TCCATTTTGA GTTTTTCCGT GTGAAAAAAA CAGGTGATTT GATGCCGTTA 
GAAATCAATT GTCGCCCACC CGGTGGCTTG ACTATTGATA TGTGGAATTA TGCAAATGAT 
TTTGATGTAT TCAGAGAATA CGCCAATATT GTGAAAGAAA ATAAATTCTA CACAAATATT 
ACACACCCAT GGAATGTGGT ATATATCTCA CGTAAAGCAA ATAAGAATTA TGTAAACGCC 
ATTGAAGATG TGCAACAAAA ATATTCTACT AATATTATTA GTGTGCAAAC TGTACCCGGC 
GTTTTTGCCA AAATTATGGG GGAACATGGC ATTTTAGCTC GCACAGAAAC TTTAGATCAG 
ATGCATGAAA TTGCACAATT TGCACAACAA AAAGCATAA

Protein sequence

MSKPLNFVMI SPHFPANFET FAVRLKECGF NTLGIADTPY EQLSENLRNS LTEYYRVDNM 
EDYEQVYRAV GYFAHKYGRI DRIESHNEYW LELDAKLRTD FNVPGYKNDD MLAIKTKAQM 
KEIFRQAGLK VAQGKVFNSD DEARKLAKKL KFPVIIKPNS GVGASDTYKI KSVQELEDFF 
SYKNAHVEYI MEEFIDGDII TFDGLTDKEG NIVFYSGLEY SECVLDTVEN DNDMFYYVPR 
EISTDLIKLG QKCVDAFNVR ERFFHFEFFR VKKTGDLMPL EINCRPPGGL TIDMWNYAND 
FDVFREYANI VKENKFYTNI THPWNVVYIS RKANKNYVNA IEDVQQKYST NIISVQTVPG 
VFAKIMGEHG ILARTETLDQ MHEIAQFAQQ KA