Gene HS_1488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1488
Symbol
ID	4241008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1679288
End bp	1680328
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	38%
IMG OID	638105069
Product	hypothetical protein
Protein accession	YP_719698
Protein GI	113461629
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0806646
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA TTTTATTCAT TGTATTGTTG TTTTTGTGTG GTGCAGGCGG TAGCGTTTTT 
TGGGCATATT GGCAAATAAC TGACTTTGTA AAACAACCTG TTAAAGTCAA AGAAGAGCAA 
CTTTTAACTG TTGTGCGAGG AACGACCGGC AATAAATTGG CAATATTATT AGAAAATGAA 
GGGTTAATCG AAAATGGGAA ATGGTTGCCT TGGCTGCTTA AATTAAAACC CGAATTGAAT 
AAAATTAAAG CCGGTACTTA TTCCCTCGTT AATGTAGAAA ATATTCGAGA TCTTCTTGAT 
GTACTTAATC AGGGCAAAGA GGTGCAATTT AATTTGCAAT TGATTGAAGG GCAACGTTTT 
AAAACTTGGC GTAAAATTTT AGAAAATGCA CCGCACTTAC GGCAAACATT ACAAGGAAAA 
TCGGAGAAAG AGATTTTTAC TTTGCTGGAG TTGCCGGCTT ATTCAAAAGC TGTTTATGAA 
TGGAAAACGA TTGATGGTTG GTTATATCCG GATACTTATA GTTACACGCC TAACTCTAGC 
GATTTGGCAC TGTTAAAACG TGCGGCTTCC CGTACCATAA AAGCGTTGGA GCGAGCGTGG 
CAACAAAGAA ATGTAAATTT GCCATTGAAA AATCCCTATG AAATGTTAAT TCTTGCTTCT 
ATTGTGGAAA AGGAAACAGC ATTGACTGAG GAGAGAGCGA AAGTAGCGGG CGTTTTTGTG 
AATCGTTTAA ATAAGCAAAT GAAATTACAA ACAGATCCAA CGGTGATCTA TGGTATGGGT 
GATAATTATA AAGGTAATAT TCGGAAAAAA GATTTATTGA CACCAACCCC TTATAATACC 
TATGTGATTG ATGGTTTACC GCCGACGCCG ATTGCTATGG TAAGCGAGGA AAGTTTACAG 
GCTGTTGCTA AACCGGAACA GCATGATTAT TTATATTTTG TCGCAGATGG AAGCGGTGGA 
CACAAGTTTA GTAAAACATT GGCAGAACAT AACCGTGCTG TGCAAGAATA TTTGCGTTGG 
TACCGTTCTC AATCAAAATA G

Protein sequence

MKKILFIVLL FLCGAGGSVF WAYWQITDFV KQPVKVKEEQ LLTVVRGTTG NKLAILLENE 
GLIENGKWLP WLLKLKPELN KIKAGTYSLV NVENIRDLLD VLNQGKEVQF NLQLIEGQRF 
KTWRKILENA PHLRQTLQGK SEKEIFTLLE LPAYSKAVYE WKTIDGWLYP DTYSYTPNSS 
DLALLKRAAS RTIKALERAW QQRNVNLPLK NPYEMLILAS IVEKETALTE ERAKVAGVFV 
NRLNKQMKLQ TDPTVIYGMG DNYKGNIRKK DLLTPTPYNT YVIDGLPPTP IAMVSEESLQ 
AVAKPEQHDY LYFVADGSGG HKFSKTLAEH NRAVQEYLRW YRSQSK