Gene HS_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1071
Symbol	prc
ID	4240570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1186675
End bp	1188702
Gene Length	2028 bp
Protein Length	675 aa
Translation table	11
GC content	36%
IMG OID	638104632
Product	carboxy-terminal protease
Protein accession	YP_719283
Protein GI	113461214
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.461658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAC CTCAACAACT TCGTTATTTG CTTTGTTTGC TGTTTGGCTT TGTTTTAAGT 
TTAAATTACG CCGTCGCAGT TGAACCAAAA CTGAAACTAA CGGATCTTGT TATTCCACAG 
ATAACGCAAG AAAATCAATT AGCAACTAAA AGAACTGCTG CTCGTTTGGT TCATTCACAT 
TATCAAGCAG TAGAACTCAA TGATGAGTTT TCTCAGCGGA TTTTTGATCG TTATTTGAAA 
GCACTTGATT TTAATCGTAA TACTTTTTTG CAATCTGATA TTGATAATAT GAGAGCAATG 
TATGCGGATA AAATTGATGA TGTGTTAAAT GAGGGAAACC TGGATATTGC TTTTGATATG 
TATGAGTTAT TGATGAAGCG TCGCTATGAG CGTTATCGTT ATGCTCTATC TTTATTGGAT 
GAAGAGCCTG ATTTAAATGG CAATGATCAA ATTGAAATAG ATCGGGAAAA AGCGGATTGG 
CCAAAAAATG AAACTGAGGC AAATAAGTTA TGGGAACATC GAGTCAAAAA TGATGTGATT 
AACTTAAAGT TAAAAGGTAA AAAATGGTCT GAAATTCAAA CGAGGTTAGT TAAACGTTAT 
AATTTAGCTA TTCAGCATCT AAGTAAAGTA AAATCTGATG ATATTGTACA ATTGTATTTG 
AATGCTTTTG CAAGAGAGAT CGATCCCCAC ACCAGTTATC TAGCGCCTCG CAAAGCTAAA 
AATTTCAATG AAAACATGAA CTTGTCTCTT GAGGGAATAG GTGCAACTTT ACAGTCAGAA 
GATGGTGAAA CCACTATAAA ATCGCTTGTT CCCGGTGCTC CGGCAGATCG TAGTAAAAAG 
CTTAAAGCCG GTGATAAAAT TATTGGAGTC GGGCAAGCGA CAGGGGAAAT TGAAGATGTA 
GTCGGTTGGC GTATTGATGA TGTTGTTGAT AAAATCAAGG GGAAGAAAGG AACAAAAGTT 
CGTTTAGAAA TAGAACCAGC TAAAGGTGGA AAATCTCAAA TTATTACGTT AGTGCGAGAT 
CGTGTTCGTT TAGAAGATCA AGCTGCTAAA CTAACAGTTG AAACTGTTGC TGGTAACAAG 
ATCGCCGTGA TTAAAATTCC GGGGTTTTAT AATGGCTTAA CTGAGGATGT ACGTAAATTA 
CTTGTTGAAG TTGAAGCTAA AAAAGCGGAA GCTTTAATCA TTGATTTACG TGGAAATGGT 
GGTGGCTCTT TACCGGAAGC TATTGAGTTA ACCGGTTTAT TTATTACTGA TGGTCCTGTG 
GTTCAAGTTC GGGACGCACA TCAACGTATT CGTATATATG ATGATCCTGA TACAGAGCAA 
GTTTATTCCG GTCCCTTGCT TGTTATGATT GACCGATTTA GTGCATCCGC ATCGGAGATT 
TTTTCAGCTG CGATGCAAGA TTATAATCGA GCCATTATCC TTGGGCAAAA TACTTTTGGC 
AAAGGAACGG TTCAGCAAAG TAGATCACTG AACTTTGTAT ATGATTCAAA TAGTATGGCT 
CCTTTGGGTT TACTGCAATA TACTATTCAA AAGTTTTATA GAATTAACGG TGGCAGTACT 
CAATTAAAAG GAGTCGCTCC GGATATTATT TTTCCCTCCT CTATTGATGA TGAAGAATAT 
GGGGAAGAAA AAGAAGATAA TGCGTTGCCT TGGGATAAAA TTCCATCAGC GTCATATTCT 
GAAGTCGGTA ATGCACGCCT GCCAGTAGAT ATATTGAATC AGAAACATCT TGAACGTATT 
GCGAAAGACC CTGAGTTTAT TGCACTGGAT GAAGATTTAA AGATTCGTGA TGAAAGAAAA 
GAACGTAAGT TTTTATCGTT GAACTTTGCT CAAAGAAAAG CTGAAAATGA TAAAGATGAT 
GAAAAACGCT TGAAAGATCT TAATGCTCGT TTCAAACGAG AAGGGAAAAA ACCACTAAAA 
GATCTTGATG CTTTGCCGAA AGATTATGAG GATCCTGATT TTTATTTAAA AGAAGCTCAG 
AAGATTGCAG TAGATTTAAT TGAATTTAAT AAAAAAATGG CTGAGTAA

Protein sequence

MKLPQQLRYL LCLLFGFVLS LNYAVAVEPK LKLTDLVIPQ ITQENQLATK RTAARLVHSH 
YQAVELNDEF SQRIFDRYLK ALDFNRNTFL QSDIDNMRAM YADKIDDVLN EGNLDIAFDM 
YELLMKRRYE RYRYALSLLD EEPDLNGNDQ IEIDREKADW PKNETEANKL WEHRVKNDVI 
NLKLKGKKWS EIQTRLVKRY NLAIQHLSKV KSDDIVQLYL NAFAREIDPH TSYLAPRKAK 
NFNENMNLSL EGIGATLQSE DGETTIKSLV PGAPADRSKK LKAGDKIIGV GQATGEIEDV 
VGWRIDDVVD KIKGKKGTKV RLEIEPAKGG KSQIITLVRD RVRLEDQAAK LTVETVAGNK 
IAVIKIPGFY NGLTEDVRKL LVEVEAKKAE ALIIDLRGNG GGSLPEAIEL TGLFITDGPV 
VQVRDAHQRI RIYDDPDTEQ VYSGPLLVMI DRFSASASEI FSAAMQDYNR AIILGQNTFG 
KGTVQQSRSL NFVYDSNSMA PLGLLQYTIQ KFYRINGGST QLKGVAPDII FPSSIDDEEY 
GEEKEDNALP WDKIPSASYS EVGNARLPVD ILNQKHLERI AKDPEFIALD EDLKIRDERK 
ERKFLSLNFA QRKAENDKDD EKRLKDLNAR FKREGKKPLK DLDALPKDYE DPDFYLKEAQ 
KIAVDLIEFN KKMAE