Gene HS_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1004
Symbol
ID	4240497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1105109
End bp	1106497
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	36%
IMG OID	638104560
Product	putative transglycosylase
Protein accession	YP_719215
Protein GI	113461147
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4623] Predicted soluble lytic transglycosylase fused to an ABC-type amino acid-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00893953
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTTTCC CTTGGCAACA AATAGTGAGA TCAAAACAGA ATTACCATAC TACAATTCAA 
GAGCGACAAA AATTGATTGT AGGAACAATC AATAATCCGG TGTCTTATTT TATCGGTACA 
AACGGAGAAA CAGGGCTAGA ATATGAATTA AGCAAGGCTT TTGCAAATTA CTTAAATGTT 
GATTTGGAAA TGTTTCCTCT AAATAGTGCG GACGCATTAT TTCAGGCTTT AGCACAAGGT 
AAAATAGACA TTGCTGCTGC AAGTTTATTT TATCAACAAG ATAGAAGTGA AAAATTCAAA 
CTAGGTCCGG CATATCACGC TGCATCTTGG CAATTGACTT ATCGCAAAGG TGAACGTCGT 
CCTATCACAT TAGAAAATTT ATCCGGCAAA TTGGTTATTC CGGCTAATTC GGCACTGAAT 
AATATTCTGC TGGCAAAAAA AGAAAAATAC CCTTCTTTAA CATGGGAAAC CAGTGAACTA 
AGCCAAGAGG AACTCTTATT TCAAGTTGCT GAAGGAAAAA TAGATTACAC AATCGCTACC 
TCTACTGAAG TATCAGTTAA TCAGCAAATT AAACCTCAAA TTGCAATTGC CTTTAATGTG 
ACTGATGAGT TTACAGTACA TTGGTACTTA TCTGATAAGG GGTCTTCAGA ATTACAAGCC 
GCACTATTAG ACTTCATGAA CTCTGCCATT GAAAACGGCT TAATTGCTCG TATTGAAGAA 
AAATATTTCA ATCACCTCAA CCAATTTGAC TATGTTGATA CTCGCTCCTA TTTGAATGCA 
ATTGAAACAG TTTTGCCTAA ATATGCTCCT TTGTTTGAAA AATATAAAGG TGATTTAGAT 
TGGCGTTTAT TGGCAGCCAT ATCTTATCAA GAATCCCATT GGAATCCGGA AGCAACCTCA 
CCAACCGGAG TACGCGGTAT GATGATGTTG ACAAAAGCAA CTGCAGATAG AATGAATATT 
ACTAATCGTC TCGATCCTGA ACAAAGCATT AAAGCCGGTT CCGAATATTT ACATCTTCTG 
CTCAAACAAA TGCCGGATAC TATTTTAAAA GAAGATCGTA TTTGGTTTGC ACTTGCCGCT 
TATAACATGG GATTGGGACA TTTATTAGAC GTTAGACGCT TAACTAAACA GCTGGGAGGA 
AATCCGGATA ATTGGTTAGA GGTGAAAAAA AATTTACCCT TATTAGCACA AAAACGTTAT 
TTTACCCATC TTAAATATGG CTACGCTCGA GGCTACGAAG CGTTTCAATA TGTGGAAAAT 
ATTAGAAGAT ATATGAACAG CATAATGAAT TATTATCGGC TTCAACAAAA CCAACAAGAT 
CGACAAGATC GGTATGAAAA TGAAAATAAT GATGTCATTT CAACACAAAC ACAACAGGAA 
CAACGATGA

Protein sequence

MVFPWQQIVR SKQNYHTTIQ ERQKLIVGTI NNPVSYFIGT NGETGLEYEL SKAFANYLNV 
DLEMFPLNSA DALFQALAQG KIDIAAASLF YQQDRSEKFK LGPAYHAASW QLTYRKGERR 
PITLENLSGK LVIPANSALN NILLAKKEKY PSLTWETSEL SQEELLFQVA EGKIDYTIAT 
STEVSVNQQI KPQIAIAFNV TDEFTVHWYL SDKGSSELQA ALLDFMNSAI ENGLIARIEE 
KYFNHLNQFD YVDTRSYLNA IETVLPKYAP LFEKYKGDLD WRLLAAISYQ ESHWNPEATS 
PTGVRGMMML TKATADRMNI TNRLDPEQSI KAGSEYLHLL LKQMPDTILK EDRIWFALAA 
YNMGLGHLLD VRRLTKQLGG NPDNWLEVKK NLPLLAQKRY FTHLKYGYAR GYEAFQYVEN 
IRRYMNSIMN YYRLQQNQQD RQDRYENENN DVISTQTQQE QR