Gene HS_0388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0388
Symbol	pepB
ID	4239864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	412919
End bp	414217
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	39%
IMG OID	638103931
Product	aminopeptidase B
Protein accession	YP_718598
Protein GI	113460534
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATTA AAATAGAAAT TTCACCAGCA AAAGAACAAT GGGGAAAAAA AGCTTTAATC 
AGTTTTACTC ACGATCAAGC CATCATTCAT CATCCGACAC GTAACCAAGA CATTTCTTTA 
ATTCAAAAAG CCGCTCGAAA ATTACGCAAC CAAGGAATAA AAGAAGTTGA ACTTATTGGA 
TCAGAATGGG ATTTAGAAAA TTGTTGGGCA TTCTATCAAG GCTTTTATAC CGCTAAACAA 
GATTATACTA TTGAATTTCC TCATTTAGAG GACGAGCCAC AAGCTGAATT GCTGGCAAGA 
ATTCAATGTG GCGATTTTGT GCGTGAAATT ATTAATCTCC CCTCTTCAAT TATCACCCCT 
ATTGAACTTG CAAAGCGTGC GGCACAATTT ATCACCGAAC AAGCAAGTCT TTATGCTGAC 
GAAAGTGCGG TATCTTTTCA GATTATTTCC GGACAAGAAC TTGCTGAAAA AAACTATCAA 
GGGATTTGGC AAGTGGGTAA AGGCTCAGAA AATTTACCAG CTATGTTACA GCTGGATTTT 
AATCCTACCG GAAATGAAAA TGCACCGGTA CTGGCTTGTT TAGTCGGTAA AGGAATTACT 
TTTGACAGTG GTGGTTACAG CATTAAACCA AGTGATAGCA TGAGTACAAT GCGAACAGAT 
ATGGGCGGTG CTGCACTATT AACGGGTGCA TTAGGTATGG CAATAGCCGG AGGGCTTAAC 
AAACGAGTTA AACTATTTTT ATGTTGTGCT GAAAATATGG TGAGCCACAA CGCTTTAAAA 
TTAGGTGATA TTATTCACTA CCGCAATGGT ATCAGTGCGG AAATTCTTAA TACTGATGCC 
GAAGGGCGTT TGGTACTTGC CGATGGCTTA ATTGATGCGG ATTTAGCGAA GCCTAAATTT 
ATTCTTGATT GTGCAACCTT AACCGGTGCA GCAAAAGTAG CGGTTGGTAA TGATTATCAT 
GCGATACTTT CAATGGATAA CGAACTCACT CAACAGTTTT TCGATTGTGC AAAGAGTACA 
AAAGAACCGT TTTGGCGATT GCCTTTTGAC GAATTACATC GTCACCAAAT TAGTTCATCC 
TTTGCAGATA TTGCCAATAT TGGGACTGTT CCAATGGGTG CCGGTGCAAG TACGGCAATG 
GCGTTCTTAT CTTATTTTGT AGAAAATTAT CAAGAAAATT GGTTACATAT TGATTGTTCG 
GCAACTTATC GTAAATCAGC AAGTGACTTA TGGGCAACAG GTGCAACGGG AATCGGTGTA 
CAAACTTTGG CGAATTTTTT ATTAAATAAA GCTGAATAA

Protein sequence

MQIKIEISPA KEQWGKKALI SFTHDQAIIH HPTRNQDISL IQKAARKLRN QGIKEVELIG 
SEWDLENCWA FYQGFYTAKQ DYTIEFPHLE DEPQAELLAR IQCGDFVREI INLPSSIITP 
IELAKRAAQF ITEQASLYAD ESAVSFQIIS GQELAEKNYQ GIWQVGKGSE NLPAMLQLDF 
NPTGNENAPV LACLVGKGIT FDSGGYSIKP SDSMSTMRTD MGGAALLTGA LGMAIAGGLN 
KRVKLFLCCA ENMVSHNALK LGDIIHYRNG ISAEILNTDA EGRLVLADGL IDADLAKPKF 
ILDCATLTGA AKVAVGNDYH AILSMDNELT QQFFDCAKST KEPFWRLPFD ELHRHQISSS 
FADIANIGTV PMGAGASTAM AFLSYFVENY QENWLHIDCS ATYRKSASDL WATGATGIGV 
QTLANFLLNK AE