Gene VIBHAR_03171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_03171
Symbol
ID	5553942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	-
Start bp	3200524
End bp	3201654
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	45%
IMG OID	640908652
Product	flagellin
Protein accession	YP_001446347
Protein GI	156975440
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGATTA ACGTTAATAC TAACGTTTCT GCGATGACCG CACAGCGTTA CCTAAACCAA 
GCGGCTGAAG GTCAACAAAA ATCAATGGAG CGTTTGTCTT CGGGTTATAA AATCAATAGC 
GCGAAAGATG ATGCTGCAGG TCTACAGATT TCTAACCGTT TGAATGCACA GAGCCGTGGT 
CTAGACATGG CTGTGAAAAA CGCGAACGAC GGTATTTCTA TTGCACAGGT TGCTGAAGGT 
GCAATGAATG AATCTACCAA CATCCTACAA CGTATGCGTG ACCTATCGCT TCAATCTGCG 
AACGGTTCAA ACTCGCGTTC TGAGCGTGTA GCGATTCAAG AAGAAGTAAC AGCACTTAAC 
GACGAACTAA ACCGTATCGC TGAAACAACT TCATTTGGTG GTAACAAGCT TCTTAACGGT 
ACTTACGGTA CTCAATCTTT CCAAATCGGT GCGGACTCTG GTGAAGCAGT AATGCTTTCT 
ATGGGTAACT TACGTTCTGA TACTTCTGCA ATGGGCGGTA AGAGCTACTC AGCAGAAGAT 
GGCAAAGATG CATCTTGGGC AGTAGGTGAT AACACTGAAC TTAAGATGAC TTACACCAAC 
AAGCAAGGTG AAGAGAAAGA GCTGACTATC AACGCGAAAC AAGGCGATGA TATCGAGCAG 
CTAGCAACTT ACATCAACGG TCAAAGCGAA GATGTAAAAG CATCTGTTGG TGAAGATGGC 
AAGCTACAAG TATTCGCTGC TACTCAAAAA GTAACAGGCG ATGTAGAGTT CTCTGGCAAC 
CTAGCGGGTG AAATTGGCTT CGGCGATGCA AAAGACGTAA CGGTTAAAGA CATCGACGTA 
ACCACAGTTG CAGGCTCTCA AGAAGCAGTA GCGATCATTG ACGGCGCACT AAAATCAGTA 
GACAGCCAAC GTGCGTCTCT TGGTGCATTC CAAAACCGTT TCAACCACGC TATCAGCAAC 
CTAGACAACA TTAACGAGAA TGTTAACGCG TCTAACAGCC GTATTAAAGA TACTGACTAC 
GCGAAGGAAA CGACAGCAAT GACTAAGTCG CAAATCCTTC AACAAGCAAG TACTTCAATC 
CTGGCACAAG CGAAGCAGTC ACCATCTGCA GCGCTAAGCT TGTTGGGCTA A

Protein sequence

MAINVNTNVS AMTAQRYLNQ AAEGQQKSME RLSSGYKINS AKDDAAGLQI SNRLNAQSRG 
LDMAVKNAND GISIAQVAEG AMNESTNILQ RMRDLSLQSA NGSNSRSERV AIQEEVTALN 
DELNRIAETT SFGGNKLLNG TYGTQSFQIG ADSGEAVMLS MGNLRSDTSA MGGKSYSAED 
GKDASWAVGD NTELKMTYTN KQGEEKELTI NAKQGDDIEQ LATYINGQSE DVKASVGEDG 
KLQVFAATQK VTGDVEFSGN LAGEIGFGDA KDVTVKDIDV TTVAGSQEAV AIIDGALKSV 
DSQRASLGAF QNRFNHAISN LDNINENVNA SNSRIKDTDY AKETTAMTKS QILQQASTSI 
LAQAKQSPSA ALSLLG