Gene VC0395_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_1008
Symbol	hlyA
ID	5134642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	986290
End bp	987792
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	49%
IMG OID	640531330
Product	haemolysin
Protein accession	YP_001215844
Protein GI	147671739
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCAC GGGAGCCGGC TGATCAACTC GGTTATCGTC AGTTTGGAGC CAGTTATACG 
ACGTTAGATG CCTATTTCCG TGAGTGGTCA ACCGATGCGA TTGCCCAAGA TTATCGCTTC 
GTGTTTAACG CATCGAACAA TAAAGCGCAG ATCCTGAAAA CCTTTCCTGT CGATAACATT 
AACGAGAAAT TTGAGCGCAA AGAGGTTTCA GGTTTTGAGC TTGGGGTGAC TGGTGGGGTG 
GAAGTCAGTG GAGATGGCCC GAAAGCCAAA CTAGAGGCGA GAGCAAGTTA TACCCAGAGT 
CGCTGGTTAA CCTACAACAC ACAAGACTAT CGTATTGAGC GTAATGCGAA GAATGCGCAA 
GCGGTTAGCT TTACATGGAA TCGTCAACAA TACGCGACAG CAGAATCGCT ACTCAATCGT 
TCGACCGATG CTTTGTGGGT GAATACCTAC CCGGTAGATG TAAACCGTAT TAGCCCGCTG 
AGCTACGCGA GTTTTGTGCC GAAAATGGAT GTGATTTATA AAGCCTCAGC CACAGAGACA 
GGCAGTACGG ATTTTATCAT CGACTCTTCG GTCAATATCC GCCCAATCTA TAACGGTGCT 
TATAAGCACT ACTATGTGGT CGGTGCTCAT CAGTCCTACC ATGGCTTTGA AGATACCCCA 
CGTCGTCGAA TCACGAAATC GGCAAGCTTT ACGGTCGATT GGGATCACCC AGTATTCACG 
GGTGGCCGCC CGGTCAACCT ACAACTTGCC AGCTTTAACA ACCGCTGTAT TCAAGTCGAT 
GCTCAAGGTC GCTTGGCGGC CAATACGTGC GATAGCCAGC AATCAGCGCA ATCGTTCATC 
TATGATCAGC TTGGTCGTTA TGTGAGTGCG AGTAACACCA AGCTCTGTCT TGATGGTGAG 
GCATTAGACG CATTGCAACC CTGTAACCAA AACCTGACTC AGCGTTGGGA GTGGCGTAAA 
GGCACAGATG AATTGACCAA TGTCTACAGC GGCGAGTCCC TTGGACATGA CAAACAAACC 
GGTGAGCTTG GTTTGTATGC GAGCAGCAAC GATGCGGTAA GTTTACGTAC CATCACCGCT 
TATACCGATG TGTTTAATGC GCAAGAAAGT TCGCCGATTC TGGGTTACAC ACAAGGGAAA 
ATGAATCAGC AGCGTGTGGG ACAAGATCAT CGTTTGTATG TGCGAGCGGG TGCTGCCATT 
GATGCATTAG GGTCCGCCTC CGATTTATTG GTTGGTGGCA ATGGTGGTAG CTTGAGTTCG 
GTGGATCTGT CCGGCGTGAA ATCCATCACG GCAACCTCTG GTGATTTCCA ATATGGCGGT 
CAGCAGTTGG TGGCGCTGAC ATTCACCTAC CAAGATGGAC GTCAGCAAAC GGTAGGCTCG 
AAAGCGTATG TCACCAATGC TCATGAAGAC CGTTTCGATT TACCGGCTGC CGCTAAGATC 
ACTCAACTGA AAATTTGGTC TGACGATTGG TTGGTGAAAG GGGTTCAATT TGATTTGAAC 
TAA

Protein sequence

MTAREPADQL GYRQFGASYT TLDAYFREWS TDAIAQDYRF VFNASNNKAQ ILKTFPVDNI 
NEKFERKEVS GFELGVTGGV EVSGDGPKAK LEARASYTQS RWLTYNTQDY RIERNAKNAQ 
AVSFTWNRQQ YATAESLLNR STDALWVNTY PVDVNRISPL SYASFVPKMD VIYKASATET 
GSTDFIIDSS VNIRPIYNGA YKHYYVVGAH QSYHGFEDTP RRRITKSASF TVDWDHPVFT 
GGRPVNLQLA SFNNRCIQVD AQGRLAANTC DSQQSAQSFI YDQLGRYVSA SNTKLCLDGE 
ALDALQPCNQ NLTQRWEWRK GTDELTNVYS GESLGHDKQT GELGLYASSN DAVSLRTITA 
YTDVFNAQES SPILGYTQGK MNQQRVGQDH RLYVRAGAAI DALGSASDLL VGGNGGSLSS 
VDLSGVKSIT ATSGDFQYGG QQLVALTFTY QDGRQQTVGS KAYVTNAHED RFDLPAAAKI 
TQLKIWSDDW LVKGVQFDLN