Gene HS_1767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1767
Symbol
ID	4241301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1989343
End bp	1990845
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	42%
IMG OID	638105360
Product	hypothetical protein
Protein accession	YP_719972
Protein GI	113461903
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.214239
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTTTA ATGTGGATAG TTATCTCGAA TATTTCCTGA CGTTGCTCGG CTGGATCATT 
AATAATGGCT TATTTGGATT GTTGGTGAGT ACCGGGCTTT TTATTGCCCC GTTAATCGGA 
ATGTTGATTA AAACTTGGCT TGAAGTGAAA AAACAAGGGG CTGATGAGGG AAATAAAGGA 
GAGTTATTAA TTGATTGGTT AAGCATACAA TTTTTCCCTG CAATGCTGGT GATTGTGCTG 
ACCCTTGCCC CAATGTTGCC GATTTCGCTG AATAATATGG CTTATAATGT GGAGCAATCA 
AAACATTGCG GTTATAAAGT GCCGTTAGCA CCTGAAAAAA CAGGTTATGC CAGTATGGTG 
AGTGAATTTG CCGGTAAACA GGCCAAAGTA CCGCTGTTGT GGGGATTAAT GCACGCCGTT 
AATAAAGGGA TTTTACACGG TGCGGTTTCA ACCATTCCTT GCAAGCTTGA TTTACGTCAA 
ATCCGCTTTG AGGTACAACA CGAAAAAATT AATAATCCGG CACTGTTGAC CGAAGTGCGT 
CAATTTGTGC AACAATGTTA TTTGCCTGCT CGTCGTAAAG TGTTAGATAG CCAAGTGTCA 
ATGAATGCGG CACAAGCTAG AGAAGTGAGC TGGCTTGGCG GGAAAATTTT AGTGAACAAT 
AGCGAACTTT ATCCCCGTTA TCGAGCAATG CAACCGATGC AACGTTGGGC TTATGAGCCT 
AACCGCGATC AGGGGCTACC CAATACGGGC AGAGGCGGTT TCCCTCATTG TGATGAATGG 
TGGGCAGACA GCCAAGTGGG GCTAAAAGAT ATGCTCCTTT CAGATATGCG ACAAAATTTA 
TCGGTGAAAT TAGGGGAAAT GTTTACTAAT GCGAATATTC AAGATGAAGC ATTACTTCGC 
ACTTTATTAC GCCCTGAAAA TATCAATATC TCCAGAGGGA AAGTATATGA GGGGTACGGT 
GGAAACTTAA ATCCTACGGG TCTTAATCGC GTCACATCCA CGGTATCAGG TCTTGGTGTT 
GCCGCGGGGA GCTTAGTTGC TTATCCGGGA TTTGATGCAA TGCGAAATTC ATTACCTATG 
ATCCAAGCAG TACTTATTAT GGCGGTCATT ATTTTAACAC CGATTGTTAT TGTGTTTAGT 
GGGTATTCTT TAAAAGCGAT TGTGACGTTG ATGTTTGTAC AGTTTGCATT AGTAACTACG 
TCATTTTGGT GGGAGTTGGC TAGATGGTTA GATTCGTCTC TTTATACTAT CATGTACCAT 
TCACCTAGTC ATACAGATAC AGATTCGTTC TGGAGTTTCC TGCGAAATGA CACCGATAAT 
ATGATTATGA GTATTGTATT AGGCGTAATG TTTTTGATTT TACCGGGTGT TTGGGTTACA 
GCAATGTCTT GGGCTGGTTT TAATGTGGGA GCGTTAGCTG ATAATTTTGC ACAAAGCTCA 
CGACAAGTTC AAGAAAGCGG TTCTGATGGA ACAAAGATTA TTGCGAAAAC AATACCAAAA 
TAA

Protein sequence

MTFNVDSYLE YFLTLLGWII NNGLFGLLVS TGLFIAPLIG MLIKTWLEVK KQGADEGNKG 
ELLIDWLSIQ FFPAMLVIVL TLAPMLPISL NNMAYNVEQS KHCGYKVPLA PEKTGYASMV 
SEFAGKQAKV PLLWGLMHAV NKGILHGAVS TIPCKLDLRQ IRFEVQHEKI NNPALLTEVR 
QFVQQCYLPA RRKVLDSQVS MNAAQAREVS WLGGKILVNN SELYPRYRAM QPMQRWAYEP 
NRDQGLPNTG RGGFPHCDEW WADSQVGLKD MLLSDMRQNL SVKLGEMFTN ANIQDEALLR 
TLLRPENINI SRGKVYEGYG GNLNPTGLNR VTSTVSGLGV AAGSLVAYPG FDAMRNSLPM 
IQAVLIMAVI ILTPIVIVFS GYSLKAIVTL MFVQFALVTT SFWWELARWL DSSLYTIMYH 
SPSHTDTDSF WSFLRNDTDN MIMSIVLGVM FLILPGVWVT AMSWAGFNVG ALADNFAQSS 
RQVQESGSDG TKIIAKTIPK