Gene VEA_000142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VEA_000142
Symbol
ID	8558447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio sp. Ex25
Kingdom	Bacteria
Replicon accession	NC_013457
Strand	-
Start bp	155892
End bp	157277
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	49%
IMG OID	646407807
Product	zona occludens toxin
Protein accession	YP_003287295
Protein GI	262395442
COG category	[R] General function prediction only
COG ID	[COG4128] Zonula occludens toxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.976786
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACTT CATTTCGATA CGGTCACGGT GGCTCTTACA AATCGGCTTG CGCCGTGTGG 
TTTGACTTAC TGCCTGCACT GCGTGAAGGT CGAATTTGCA TTACGAACAT TCATGGTATG 
CAGCCACTTG AAGTGATTGA ACAACGCCTT GGTGAGAAGT TCCCTGATAC CGCTCGGCTC 
ATTCGCATTA GCTCTCGCAA CCCTGAAGGC TTCGAGCTTT GGAAATACTT CTTCTGTTGG 
GCACCCATTG GGGCGTTCAT CCTCATTGAT GAGTGTCAGC AAATCTTCTC GGTCAATGCA 
GGTTTCAAAA TGGCGAACAT ACACAAGCGC CCTTTCACTG ACTTTGAGCC TCACTTACCG 
GAAGGATTCT CTGAGCTGTT TCACTCTCGT TGGCTAACGA TTGATACATC CAGTTTGGAC 
AATGGCGAGA TAGACGATTG CCAACGCACA CGTTTTGATG AGCAAGGACG CATCATCTAT 
CCAGAGAACT TTAACAACGC CTTTATGGAG CACCGGCATT ATAACTGGGA CATTGTGTTG 
CTCACGCCTG ACTTTGCTCA AATCCCGAAA GAGTTAAAAG GTGTCGCGGA GTTGGCCAAG 
CAACATAAGG GGAAAGATGG GATCTTCTTT TCCAACCGAA AACCGCGCAT CTTGGAGCAT 
GACCCAACTC GAACGGTCAC CAAACCAAGC AAAGATGATG TGGTTTATAA CCTCAAGGTG 
CCGCTTGATG TCCACCTACT CTACGCCTCG ACTGTCACGG GGCAAATCAC CAAATCGGGA 
CTTGGGAAGA ACATCTTTCT TAACCCGAAA TTCTTAGCAG CTATGGCACT GGTCGTGCTT 
TCATTTGGGT ACTTAGTTTA TGCGCTTATT GGTATGGTTT CTGATTCTGA GACGACAACT 
GCGGAAGGAA CGCAGCTTCA TCAAACTTCG CAGCAAAGTG GCGTTTCGAC TTCGCAAGGT 
CAAGCACGTC CTGGTCAAAG TGGTTCGCCT GGTTCTGTCA TGGGTTCTAG TGGTTCTGGC 
TGTACGGGTT CTGGTTGCGG GAATGAGTCT TATCATGACG TAGGTACCGT TCCGGCTTGG 
TTCCCACTGG CGAACTCAGA GAGTATCTAT GTCTCTGCGG TGGAACGTTG GCACAAAGCC 
ACCTCGATAC ACGTCAACGT GCATTTTGAG GTTGTCACAC CGCGTGGTGT GACTTACCTC 
GATGACGGAT TCCTAAACAA GTTGGGCGTC AAGATGGAAT ATCTGGACGA TTGCCTCGTC 
CAGCTGTCTC GCGGTGCATC CAACTTCTAT GTCACGTGTT CGCCGTATGA GCAATATGCA 
CAACGGCAAG AGCAAGATAT TGAACTAAAA CCCGTTGGCG GTTTGTTTAG TGGAGACGAA 
ACCTAA

Protein sequence

MATSFRYGHG GSYKSACAVW FDLLPALREG RICITNIHGM QPLEVIEQRL GEKFPDTARL 
IRISSRNPEG FELWKYFFCW APIGAFILID ECQQIFSVNA GFKMANIHKR PFTDFEPHLP 
EGFSELFHSR WLTIDTSSLD NGEIDDCQRT RFDEQGRIIY PENFNNAFME HRHYNWDIVL 
LTPDFAQIPK ELKGVAELAK QHKGKDGIFF SNRKPRILEH DPTRTVTKPS KDDVVYNLKV 
PLDVHLLYAS TVTGQITKSG LGKNIFLNPK FLAAMALVVL SFGYLVYALI GMVSDSETTT 
AEGTQLHQTS QQSGVSTSQG QARPGQSGSP GSVMGSSGSG CTGSGCGNES YHDVGTVPAW 
FPLANSESIY VSAVERWHKA TSIHVNVHFE VVTPRGVTYL DDGFLNKLGV KMEYLDDCLV 
QLSRGASNFY VTCSPYEQYA QRQEQDIELK PVGGLFSGDE T