Gene HS_1686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1686
Symbol	apbE
ID	4241213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1912526
End bp	1913575
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	35%
IMG OID	638105272
Product	thiamine biosynthesis lipoprotein
Protein accession	YP_719891
Protein GI	113461822
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAGA AATTATTATT AAATTTAATA AATATATTTG CGTTGGTATT TTTACTTAGT 
GCTTGCCAAA AAGAAGCTGA GTTAGTGTCA TTAAATGGTA GAACCATGGG TACAACTTAC 
CATATCAAAT ATATTGATGA GGGCAAGACT AAGTTAAGTG TACAAAAAAT GCACGAAGGC 
ATTGAAGGTA TCTTACAAGA TGTAAATGCT AAAATGTCCA CTTATATTCC TAATTCAGAG 
TTAAGTGTGT TCAACAAAAA CAAGGAGATA AATAATCCCA TTGAAATTTC CGCAGATTTG 
GCTTTTGTAG TTGCTGAAGC AATAAAGTTA AATCAAATTA CTCAAGGTGC TCTAGATGTA 
ACAGTTGGTC CTATTGTGAA CTTATGGGGT TTTGGACCGG AAAAACGGGT AGAAAAAGCA 
CCCACACCGG AACAAATAGC TGAACGAAAA GCCTGGGTAG GTATTGAGAA AGTTAGACTA 
ACACAAAAAG ACAATAAATT CTTTTTGACC AAATCTGTGC CGCAGATTTA TATTGATTTA 
TCTTCTATTG CTAAAGGTTT TGGTGTCGAT AAAGTTGCTG ATTATATTGC TGAGCAAGGT 
ATTACTGACT ACTTAGTGGA AATTGGCGGT GAGATTCGAG CAAATGGTCA TAATGCTGAA 
AATAAAGCTT GGCAAATAGC TATTGAAAAG CCAACCTTTG ATGGAACTCG ATCTGTATCA 
CAAGTTGTCG GTTTACAAGA TTTGGCTATG GCAACTTCCG GGGATTATCG CAATTATTTT 
GAGCAAGATG GAAAACGTTT TTCCCATGAA ATAGATCCTA CAACTTGCCA GCCCGTTCAG 
CATAATTTAG CCTCAATTAC AGTCTTATCT AAAAGTGCTA TGACTGCAGA CGGCTTATCC 
ACAGGTTTAT TTGTTTTAGG TGCGGAAAAA GCACTGGAAA TTGCTGAGCA AAATGATTTA 
CCTATTTATT TAACGGTCAA AACTCCACAA GGGTTTGAAA ATAAAATGTC CTCTAAATTT 
GCTGAAATAT TATCAACTCA GAAAAAATAA

Protein sequence

MTKKLLLNLI NIFALVFLLS ACQKEAELVS LNGRTMGTTY HIKYIDEGKT KLSVQKMHEG 
IEGILQDVNA KMSTYIPNSE LSVFNKNKEI NNPIEISADL AFVVAEAIKL NQITQGALDV 
TVGPIVNLWG FGPEKRVEKA PTPEQIAERK AWVGIEKVRL TQKDNKFFLT KSVPQIYIDL 
SSIAKGFGVD KVADYIAEQG ITDYLVEIGG EIRANGHNAE NKAWQIAIEK PTFDGTRSVS 
QVVGLQDLAM ATSGDYRNYF EQDGKRFSHE IDPTTCQPVQ HNLASITVLS KSAMTADGLS 
TGLFVLGAEK ALEIAEQNDL PIYLTVKTPQ GFENKMSSKF AEILSTQKK