Gene HS_0427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0427
Symbol	virE
ID	4239903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	454967
End bp	456397
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	33%
IMG OID	638103970
Product	virulence-associated protein E
Protein accession	YP_718637
Protein GI	113460573
COG category	[R] General function prediction only
COG ID	[COG5545] Predicted P-loop ATPase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTATCA CAGAAAAAAG AAAGGATTTT ATCTTGAATA GTTGGATTAA GATTTCCGAT 
GATTGCTTAA AAGAATACCT ATCAAGAGAG TTAGAACTGA CAGATAAGGG ACAAGTGAAA 
AGTACAACTA CAAATATTAT TACAGCGATT GTAAATCCAG ATTATTGTGT TAGTCATAAG 
ATTTTAAACG GTAGCGTGTT TTTTGACACA TGCTCACAGA CGATTAGGCT TATAGGTTCA 
ATTAAAGGGG AAAGTGAAGT TAATTTAAAA GCTCCAAGAA AATGGACGGA TCAACTTACT 
AATCTACTCG GTGTAGAAAT TGAAATGAAC TTTGGTATTA AATATTCTAA AGGCAGAATG 
GAAGAAGCGG TAATCTTCAT TGCAAATAAA AGAAGAGTTA ATTTACCAAA ATTATATATG 
AAATCTCTTA AGTATGATGG TGAAGATTAT ATTTCAAAGC TGCTTCCTAA ATATCTTGGT 
GTAGATGATA CAGCTCTTAA TCGTTGGATT ATGGAACATA TGCTGATTGG AATGGTAAAT 
AGAGTGTTTT ATCCTGGATG TAAATTTGAT GAGATTATGG TTCTTACTGG TGAGCAAGGC 
GTTGGTAAAA CGTCTTTTAT AGAAAAATTG GCACTACTTC CTGATTGGTA TTGTTCCCTA 
AATAATATCA AAGGTAAGGA CGCTGTAAGT AATCTAGTAG GTAAAATTGT AGTAGAGCTT 
GAAGAGTTTG TTGCCCTTAA AAATGCCAAG ACAGCAGATG AAGCAAAGCT ATTTATTTCT 
ACGAGAACTA GCACAGTAAG ATTGTCTTAT GAGAGATTTT CGGCTGATGT AGATAGAACA 
TGTATCATGA TTGCTACAAC AAACGACATG ACTTTCTTAG GAGATTTTTC TGGAGAAAGA 
AGATATTTAC CTGTGCAAGT TCATAAAGAA AAAGTTGGAT TGCCTGTAAT GTATGACCAA 
GAGAAATTTC CACAATTAAA AGGTGTAAGC AGAGAAGAAT ATTCAAAAAT AGTAAAGAAA 
GACTTTGAAG GAGCAGTAGC TCAAGCGGTG TATCTTTTTG AAAATAAACT ATATAGTCCA 
GTGCTTCCGG TAGAGCTAAG AAAAGATTTA AATCAAGTAA TACAAATGCA CAAGAACGAA 
AACCGACATG TGCAAAATTT CTTTGAGTTT ATGGATTGGA AAGATACAAA ATCAGATACA 
CCAAATCGTG TTTGTTCTGG AGAGTTTTTA TCCCAGTATC CACAAACTAA TGAAAAAGTA 
TTTGCAGAAT TGATGGCAAA TGAAATGGCT GATAAATGGG AATTAGAGCC GACAGATAAA 
AGCAGGAAGT TTAAGATTGA TGGCAGAGTA AGGGTGAGTA AGAAGTTTTA TGTAAGAAAG 
AATATGCCTG ATTTTATAGA AGTTACAGAT GATATTGAAA TACCATTTTA G

Protein sequence

MTITEKRKDF ILNSWIKISD DCLKEYLSRE LELTDKGQVK STTTNIITAI VNPDYCVSHK 
ILNGSVFFDT CSQTIRLIGS IKGESEVNLK APRKWTDQLT NLLGVEIEMN FGIKYSKGRM 
EEAVIFIANK RRVNLPKLYM KSLKYDGEDY ISKLLPKYLG VDDTALNRWI MEHMLIGMVN 
RVFYPGCKFD EIMVLTGEQG VGKTSFIEKL ALLPDWYCSL NNIKGKDAVS NLVGKIVVEL 
EEFVALKNAK TADEAKLFIS TRTSTVRLSY ERFSADVDRT CIMIATTNDM TFLGDFSGER 
RYLPVQVHKE KVGLPVMYDQ EKFPQLKGVS REEYSKIVKK DFEGAVAQAV YLFENKLYSP 
VLPVELRKDL NQVIQMHKNE NRHVQNFFEF MDWKDTKSDT PNRVCSGEFL SQYPQTNEKV 
FAELMANEMA DKWELEPTDK SRKFKIDGRV RVSKKFYVRK NMPDFIEVTD DIEIPF