Gene VIBHAR_01945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_01945
Symbol
ID	5553221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	-
Start bp	1950551
End bp	1951711
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	40%
IMG OID	640907432
Product	hypothetical protein
Protein accession	YP_001445137
Protein GI	156974230
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTTC CCGTAATTCG CCCCCGTAAC ACAATGTCTA TTCACGCAAT AGGCTCATGT 
CAGTTGAGTT TCATAATAAA TTACAGCATC ATAGCCGGAA AAAACCCTTC TATAAGCGCT 
ACCGCCCTTG GTGAGTTAAG AGGAATTATG GCAAGAATTT GGTTTTCTCC TGGTGACTTA 
GCAGATCATC TCCATGAGAT AGTTGGCTAC AAAGCTGGCA TAGCTAGTTC AATTGAACAG 
ATGTGCGATT TGTTATCAGG TACCGCCTAT GCTGATGATT TATATAGATC AGAAAGTAAT 
GGGCTTGCGC TTCGTTCTGA GGATTATGAG GATTTGTATT ACCAACTTTT ATATAAAGTC 
GGGGTTACGG ATACTGCAAG ACCTGGACTA TTTACACAGT CTGAGTTTTT CAAAAGAGTT 
ATGAAAGAAA AAGGTCTCGA TTATCTCACT GATATTCAGG ACATCTATAG CAAGCATTAT 
CGCTTGGGTG TTGAGCAAGC AGTTAAAAGT GGTCAAAGTT CTATAGATCC TAAGCCAATG 
CTCGCTGAAG TGATGATGAA GTATGGTACG ACAGGTGCGC ATGATCTTAT TGATTTAATG 
AAAATCTATA ATACCCACTT TCAGAATAGT CCTCACACAT CAGGTCGCTG GGAAGATTGG 
AAAGACATCG TGAATCTGAA TGATCTATTC GAGAAACATC AACCTGTAGT TTCACATGGT 
ACTTTTCTAG ATCAGCGATT TATCAATTAC CTTTCGAATA ATGCAGCTCG GTTGGGTGAA 
ATTCACTGGC GAAAATTCGA AGAACTGATT GGCGAGTGCT TTAGTCGTTC TGGTTATGAA 
GTTGAACTTG GACCAGGTAC AAATGACGAT GGAATCGATG TTCGTGTTTG GAATGATTCT 
GCTCAAGTAC ACCCTGAATT CATCATTCAA TGCAAACGGT ATAAATCGAA AATCGATAAA 
GTAACTGTGA AAGGCTTATA TGCTGATGTC CTAGAAGCAC AAGCTACAAC TGGTCTCCTT 
GTAACTACAT CAGAATTCAG TCCTGGTGCT AGAACAACCA TTTCAGCTCG AAGTTACCCA 
ATTAAGGAAG TTAATGGAGA AAAGGTTTCT GAGTGGCTAC AAGCTCTGAG AACTCCAGGC 
TCAGGTATAA TCAGGGTATA G

Protein sequence

MEFPVIRPRN TMSIHAIGSC QLSFIINYSI IAGKNPSISA TALGELRGIM ARIWFSPGDL 
ADHLHEIVGY KAGIASSIEQ MCDLLSGTAY ADDLYRSESN GLALRSEDYE DLYYQLLYKV 
GVTDTARPGL FTQSEFFKRV MKEKGLDYLT DIQDIYSKHY RLGVEQAVKS GQSSIDPKPM 
LAEVMMKYGT TGAHDLIDLM KIYNTHFQNS PHTSGRWEDW KDIVNLNDLF EKHQPVVSHG 
TFLDQRFINY LSNNAARLGE IHWRKFEELI GECFSRSGYE VELGPGTNDD GIDVRVWNDS 
AQVHPEFIIQ CKRYKSKIDK VTVKGLYADV LEAQATTGLL VTTSEFSPGA RTTISARSYP 
IKEVNGEKVS EWLQALRTPG SGIIRV