Gene HS_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1022
Symbol	rec2
ID	4240520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1128741
End bp	1131167
Gene Length	2427 bp
Protein Length	808 aa
Translation table	11
GC content	35%
IMG OID	638104583
Product	recombination protein 2
Protein accession	YP_719234
Protein GI	113461165
COG category	[R] General function prediction only
COG ID	[COG2333] Predicted hydrolase (metallo-beta-lactamase superfamily)
TIGRFAM ID	[TIGR00360] ComEC/Rec2-related protein [TIGR00361] DNA internalization-related competence protein ComEC/Rec2

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.949854
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTCA ACCTTGATCA TTACCTTTTT GTTATTTTAG CGAGTGCAAT GACATTGCTA 
ATTACACCTC GTATTTTTTT ATTGAATTGG CAATGGATAT TGATCTTATG TCTTGTTCTT 
GGGTTAGGAT ATATTGGTGT CAAAGCAGTA TTTTTTCGCT GTGTTCTAAA GCTATTTTTC 
ATTTTTGTTC TTGGGGTGGG ATTTTTTCAT TATCAAGCAT TAAACTTGTT GGAACAAAGT 
GAGCATATTA CCCGCTTACC TAAAAAAGTA CAAACTAACG TTAAAATAGC TGAAATTATT 
CAGCAGAAAG ACTATCAAGC AGTGATCGCA GAAGGAAATT TCACCTCATC TTTGCCAACA 
CAGCGAATTT ATTTAAATTG GCGTACTGAG CAAGAAGTTC AAGTTGGTGA AATTTGGCAA 
GTAAATATGC ACATTCGTCC GATTTCTTCT CGATTAAATA TAGGAGGATT TGATCGTCAA 
ACCTGGTATT TAGCAAAAGA AATTACAGCT TATGCCACAG TAAAAAGTGC GGTGAAAATT 
GGTGAGGATT TTTCTTGGCG AGCTACTCGA CTGAATCAAG CTTTACAACA AACTTCCAAT 
TTAGTTTCAC AAGGTTTATT GCTTGCATTG GGTTTTGGTG AAAGAGCCTG GCTAGACAAG 
GAATTATGGC AACTTTATCA ACAAACCAAT ACCGCACATT TAATTGCAAT TTCAGGGTTG 
CATATTGGTT TAGCTATGTT CATCGGTTTT ACATTAGGGC GAGCTATTCA ATTATTATTC 
CCTACTCGTT ATATTGAACC TTATTTTCCT TTAATATTAG GGATTTTTTT AGCATTCTGT 
TATGCAGAAT TAGCGGGATT TTCAATTCCT ACTTTTCGTG CGATTGTCGC TTTATTTATA 
GTTTGTTTGT GTCGTATATG TCGAGTTTCC TATAATGTTT GGCAACTATT TTTGCGGGTT 
ATTTGTGTTT TACTGATACT TAATCCATTT ATGTTATTGT CAGCCAGTTT TTGGCTATCA 
ATCGGAGCGG TAGGTTGTTT GATCATGTGG TATCAATGGA TACCGCTAAA TTTATTTTTA 
TGGAAAGAAA AGCCTTTGGC ACAATCTTCC TTGAAAAAAG TGCGGTATTT TATCGGTCTT 
TTTCATTTGC AATTTGGGCT TTTGTGGTTT TTTACACCTA TCCAACTCTT AATTTTTAAT 
GGTATCGCCT TAAATGGATT TTGGGCTAAT TTATTATTGT TGCCTTTGTT CAGTTTTTTG 
TTAGTTCCAC TTATTCTTTT TGCTGTACTG ACGGAAGGTG CGTTAAATAG TTGGAATATA 
GCTGATCAGC TTGCTATATG GATCAATCAA TTGTTAAAGC TGTTACCAAA TCAGTGGATC 
AATATTTCTC TTGCAGAAAG CTATTTTATT TCAGCTATAT TAGCTTTGCT CTTCACCTTA 
TGCTGTAAAT GCATTATTAA GTGTTCAACC GACGATGATT TATCTTTATT GAGAAAAGTT 
AGAAAAAAAA GTTTTTACCC TATACGGTTG AATTTTTCGG ACGGTTTTTC ACATAAAAAA 
TATCAATATG GTATGGTGGT CAGTTCAGCT ATGTCTGTTA TTTTTTTATG TCTGTGGTTT 
TTTTCGCTAT ATGAACAAGG GCGATTAAAA AACACACAAT GGCAATTTGA TACTCTAGAT 
GTTGGTCAAG GATTGGCAAG TTTATTGGTA AAAAATCAAC ATGGAATTTT GTATGATACG 
GGAGCAAGCT GGAAAAATGG TAGTATGGCA AAAATTGAGA TTATTCCTTA TCTAAGAAGA 
CAGGGTATTA TTCTTGATAA AGTTATATTA AGTCATGATG ATAATGATCA TGCAGGTGGA 
GTAAAAGATA TTTTCCAAGC TTATCCGAAT GCTGAGTTTA TCAGTCCCTC ATTAAAAAAG 
TACGAGAATT CTCCAGAAAA TAGACCGCAT ATTGCTTGTC AAAAAGGAAA AATATGGCAT 
TGGCAAGGGT TATATATTGA AGCCTTATCG CCAAGTAAAA TTGTGATGAG AGCCAATAAT 
CCGGATTCTT GTGTGCTGAT AATTTCAGAT GGACAGCATA AAGTATTATT AACAGGAGAT 
GCTGATGTGG CGACTGAATA TAAAATTTTG TCTGACTTGG GTAAGATTGA TGTGTTACAG 
GTCGGACATC ATGGTAGTAA AACGTCAACC GGTGAGAAAT TACTACAGCA TATTCAGCCT 
AAAATTGCTT TAATTTCCAG TGGACGTTGG AATCCTTGGG GATTTCCGCA TCAAGATGTC 
GTCAAACGCT TAAATGCGGT TGAAAGTGCG GTCTATAATA CGGCCATTTC CGGTCAAATT 
CGTTTAATAT TCAAAGGAAA AGATATTCAA ATTCAAACCG CAAGGACAGA GTTTAGCCCT 
TGGTATAGAG GATTAATTGG CTTGTAA

Protein sequence

MKFNLDHYLF VILASAMTLL ITPRIFLLNW QWILILCLVL GLGYIGVKAV FFRCVLKLFF 
IFVLGVGFFH YQALNLLEQS EHITRLPKKV QTNVKIAEII QQKDYQAVIA EGNFTSSLPT 
QRIYLNWRTE QEVQVGEIWQ VNMHIRPISS RLNIGGFDRQ TWYLAKEITA YATVKSAVKI 
GEDFSWRATR LNQALQQTSN LVSQGLLLAL GFGERAWLDK ELWQLYQQTN TAHLIAISGL 
HIGLAMFIGF TLGRAIQLLF PTRYIEPYFP LILGIFLAFC YAELAGFSIP TFRAIVALFI 
VCLCRICRVS YNVWQLFLRV ICVLLILNPF MLLSASFWLS IGAVGCLIMW YQWIPLNLFL 
WKEKPLAQSS LKKVRYFIGL FHLQFGLLWF FTPIQLLIFN GIALNGFWAN LLLLPLFSFL 
LVPLILFAVL TEGALNSWNI ADQLAIWINQ LLKLLPNQWI NISLAESYFI SAILALLFTL 
CCKCIIKCST DDDLSLLRKV RKKSFYPIRL NFSDGFSHKK YQYGMVVSSA MSVIFLCLWF 
FSLYEQGRLK NTQWQFDTLD VGQGLASLLV KNQHGILYDT GASWKNGSMA KIEIIPYLRR 
QGIILDKVIL SHDDNDHAGG VKDIFQAYPN AEFISPSLKK YENSPENRPH IACQKGKIWH 
WQGLYIEALS PSKIVMRANN PDSCVLIISD GQHKVLLTGD ADVATEYKIL SDLGKIDVLQ 
VGHHGSKTST GEKLLQHIQP KIALISSGRW NPWGFPHQDV VKRLNAVESA VYNTAISGQI 
RLIFKGKDIQ IQTARTEFSP WYRGLIGL