Gene HS_1543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1543
Symbol
ID	4241064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1740598
End bp	1741956
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	40%
IMG OID	638105123
Product	outer membrane protein
Protein accession	YP_719748
Protein GI	113461679
COG category	[U] Intracellular trafficking, secretion, and vesicular transport [W] Extracellular structures
COG ID	[COG5295] Autotransporter adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.316973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TACAATTTTT TAAATATTCA TCATTGGCAT TAGCATTGGG TTTAGGGGTA 
AGTGCTTCTG CTTTGGCAGC CCCAACAAGT ACAAGTACGA CTACTGGACC AGAGGCGCCT 
CCTACAGGCC CTGCTCCTAC GGCGAAAGAC CCTCTAGCAG AAACAGCGTT AGCCTATGAT 
TTGGAGAACG AAGTTGCGTA TCTTCGTATG AAGGCGGGTG AGTGGATGCA ATTGGGGCTT 
GATCCTGAAA AAGAAGTCAT CAAAGGCTGG AATGAGGTAA AATCTCTCCC TCGTATCGAT 
GGAAATGGAA AGGATAAACA GACAAAAGAT CAAATAGCAA TGTTGATAAG AACGGTTGAT 
AATACAAAAG AGCTTGGTCG GATCGTTAGT ACAAACATTG AAGATATTAA GAACCTTAAA 
AAAGAGCTTT ACGGTTTTGT AGAAGATGTG AACGAGAGTG AAGCACGCAA TATCTCAAGA 
ATAGATGAGA ATGAGAAAGA TATTAAGAAC CTTAAAAAAG AGCTTTACGA TTTTGTAGAA 
GATGTGAACG AGAGTGAAGC ACGCAATATC TCAAGAATAG ATGAAAATGA GAAGGACATT 
AATACTCTTA AAGAGCTAAT GGATGAGGAT TTAAATTCAG TCTTAACCCA AATTGAAGAT 
GTAAAACTCA CATTTCAAGA TGTCAATGAT AACGTTAATT TGGCATTTGA AGAGATTAAT 
GGAAATGCCC AAAAGTTTGA CACTGCTATT GAAGGACTTA CTTCAGGTTT GAGCGATTTA 
CAAGCTAAAG TCGATGCAAA TAAACAAGAA ACTGAAGACG ATATTGCGGA CAATGCCAAG 
GCTATTCATA GCAACACAAA AGGTATTGCT AAAAATACCA AGGATATTCG TGACTTGGAC 
ACCAAAACCA AGCAAATGTT GGAAAATGAC AAAAACTTGA TGACCGGTTT AGAATCTTTA 
GCAACAGAAA CAAGCAAAGG CTTTGAAAGA TTTGATGTCA AAACACAACA ATTAGATCAA 
GCCGTCGCAA ATGTCGTCGG TCGAGTAGAC ATAACTGAGC AAGCTATTCG CCAAAACACT 
GCAGGCTTAG TCAATGTGAA TAAACGTGTC GATACACTCG ACAAAAACAC CAAAGCCGGT 
ATCGCTTCTG CAGTCGCTTT AGGTATGTTG CCACAATCCA CTGCTCCGGG TAAATCATTA 
GTGAGCTTAG GTGTCGGTCA TCACCGTGGG CAAAGTGCTA CTGCTATTGG AGTATCTTCT 
ATGAGCAGTA ACGGTAAATG GGTTGTTAAA GGCGGTATGA GCTATGATAC ACAGCGTCAT 
GCTACTTTCG GCGGTTCTGT CGGTTTTTTC TTTAACTAA

Protein sequence

MKKVQFFKYS SLALALGLGV SASALAAPTS TSTTTGPEAP PTGPAPTAKD PLAETALAYD 
LENEVAYLRM KAGEWMQLGL DPEKEVIKGW NEVKSLPRID GNGKDKQTKD QIAMLIRTVD 
NTKELGRIVS TNIEDIKNLK KELYGFVEDV NESEARNISR IDENEKDIKN LKKELYDFVE 
DVNESEARNI SRIDENEKDI NTLKELMDED LNSVLTQIED VKLTFQDVND NVNLAFEEIN 
GNAQKFDTAI EGLTSGLSDL QAKVDANKQE TEDDIADNAK AIHSNTKGIA KNTKDIRDLD 
TKTKQMLEND KNLMTGLESL ATETSKGFER FDVKTQQLDQ AVANVVGRVD ITEQAIRQNT 
AGLVNVNKRV DTLDKNTKAG IASAVALGML PQSTAPGKSL VSLGVGHHRG QSATAIGVSS 
MSSNGKWVVK GGMSYDTQRH ATFGGSVGFF FN