Gene VIBHAR_02221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_02221
Symbol
ID	5553881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	-
Start bp	2219373
End bp	2220800
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	46%
IMG OID	640907708
Product	hypothetical protein
Protein accession	YP_001445411
Protein GI	156974504
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID	[TIGR03007] polysaccharide chain length determinant protein, PEP-CTERM locus subfamily

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATT TAAGGGACAA CCTCACTCTT TTACTGCACG GGGCATGGCG ACGCCGTTAC 
CTGCTCGTCA TCCCTATGAT AGTGCTACCT ATTTTGGGCT TTCTTATCAG CAAAGCAGTG 
CCGACTAAGT ATGTGGCTCA CACCAGCATG CTGATCCAAG AAACGGCCAA AATGAACCCA 
TTCCTTCAAG ACCTTGCCGT TTCAACCATG TTGAAAGACC GCTTGAGTGC TTTGAGTACC 
CTACTTAAAA GCCGCCATGT GCTGTATTCC GTTGCAAAAG AGCAAGGCTT GATCGACGAT 
ACTATGGACG CTAACGAACA AGAGTTCATC ATAAAAGACC TTGCTAATCG CTTAACGGTT 
CAACAACTCG GTAAGGACTT CATTCAAATC CAACTCACGA GCAGCCAATC AGAAGGGATG 
GAAGCGGTGT TAAGCTCTGT CAGCAATCAC TTTGTCGAAC AGCTCTTAGC GCCAGAGCGC 
TCATCAATAA AGGATTCTAG CCACTTCTTG ACTATTCACA TTGATAAACG CCGTGAAGAA 
TTGGACAAAG CGGAACAAGC TTTTGCTGAA TACAAAAACG CTTATTCTCA TGCAACACCA 
GCGATGCAAG CACAGAGCTT GACGCGTCTC GCCAGCTTAA AACAAACATT GGCAGAGAAG 
GAAGCCGAGT TAGCGGGTGT CAAGCGTAGC CTTGGTAGCT TAGACCAGCA ACTTTCAAAG 
ACCAATCCAG TGATTGGTAA GATTGAAGAG CAAATTATCG AGATTCGAAG TGAGCTCACT 
CTATTGCGTG CACGATACAC AGAAGCACAC AGTTCAGTGC AAGGTAAACT ACGTGAGTTG 
AATCGCCTGG AACAGGAGCG CTCAGTACTA CTCAACTCAA AACAACCGGA AATGAACAGT 
GACCAACTTT GGGATATTGC AAGTACAACG ACCATAAGCA CGATTGGTGA TGCTCAACCG 
CTGCTTGTAT CTCAACTCCG CCAACTGCAA ATCATGCGCG GCCGTTACGA GTCTTTGGAA 
GAAGAGACGA TTAGCCTTAG AAACATGATC CAAGAGCTGG AAAGCGACGC CAATCGCTTT 
GGTAGCACAG CAACAGAGAT CAATCGACTT GCTCGTGATG TCGCTGTAAA GCGTGAACTT 
TATGATGATC TGGTTGAACG TTACGAGATG GCGCAATTGA CCGGATCTTT AGGTGTTTTT 
GAAGAAAACA AACGCGTAAA AGTTATCGAT GAGCCTTACA CGCCAACCTT GCCAGCTAAC 
TTACCTGCTA TTATCTTTGT CCTTCTTGGA TTAATTGGGG GGGCAGGTTT AGGCATTGGC 
CTTGCCACCA TTGCAGAACT GGCAGATAAC TCTATTCGCT CTCGCAAAGC ATTGGAAAAA 
CACCTTGGCG CTCCTGTCAT CACTACCATC CCTAAAATCA TATTCTGA

Protein sequence

MSDLRDNLTL LLHGAWRRRY LLVIPMIVLP ILGFLISKAV PTKYVAHTSM LIQETAKMNP 
FLQDLAVSTM LKDRLSALST LLKSRHVLYS VAKEQGLIDD TMDANEQEFI IKDLANRLTV 
QQLGKDFIQI QLTSSQSEGM EAVLSSVSNH FVEQLLAPER SSIKDSSHFL TIHIDKRREE 
LDKAEQAFAE YKNAYSHATP AMQAQSLTRL ASLKQTLAEK EAELAGVKRS LGSLDQQLSK 
TNPVIGKIEE QIIEIRSELT LLRARYTEAH SSVQGKLREL NRLEQERSVL LNSKQPEMNS 
DQLWDIASTT TISTIGDAQP LLVSQLRQLQ IMRGRYESLE EETISLRNMI QELESDANRF 
GSTATEINRL ARDVAVKREL YDDLVERYEM AQLTGSLGVF EENKRVKVID EPYTPTLPAN 
LPAIIFVLLG LIGGAGLGIG LATIAELADN SIRSRKALEK HLGAPVITTI PKIIF