Gene Hneap_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1766
Symbol
ID	8534924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	1900498
End bp	1901439
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	51%
IMG OID	646384148
Product	flagellar hook-associated protein 3
Protein accession	YP_003263636
Protein GI	261856353
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID	[TIGR02550] flagellar hook-associated protein 3

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGTTT CTACTTCCAT GGTGTTTGCA CAGGGCCTGA GCAATCTGCA ACAGCAGCAG 
TCCGCGATGT TGCAGTCTCA GCAAGAAATC GCAACGGGTG TGAAACTGAC CAACCCGGCG 
CAAGATCCGG TCGCCTTTTC GACGGCTAGC GATCTGTCTG TGCTCAATAG CAAGCAGAAT 
CAGTACAGTA CGAATATCGA CAATGCGACC GGTAAGATTC AGGTGCAGGA ATCGACCTTG 
GGTTCAATTA CCACGATGCT GCAAAGCGTG CGTGATGTTG CCATCCAAGC GAACAACGCT 
GCGCAAAATG GCATGTCACT GTCCGCACTG ACGGATCAAC TGGATCAACT GCAAAAGGCT 
TTGGCTGGTC AAATGAATGC CACGGACGAG CGCGGGGAGT ATCTGTTTTC CGGTACGGTC 
GCACGTGAAA AACCCTATGA CGCCAGCGGT CAGCTTAATC CCGCCTTGGA TTCCACCAGT 
CCGTCTTTTC AAAACGTCAC AAGTGTCAAG TTGGCCATTT CCGATCAGCA GTCCGTGGCC 
ATTAATCAGC CAGCCGGGCA GATTTTCCAA CTCTCATCCA GTGCAACGAC AGGCGGAAAT 
GCCAGCATTC TGCAAGTCAT TGATCAACTG AAAACGGCTA TTACGACCCA GCCCGCAAAT 
CTCCAGACTA TTTATCAAAA TGCGCAAAAA GATATTGATG CTGTGATGAA CCAGGTGACG 
GACGCGCGCG GCAGCATGGG TAATGCGCTC AATACGCTGA GCACGGCTAA AAACGATAAC 
GCCGCACAAA ATGTGCTTAC CCAACAAACG CTTTCCGGTT TGCGCGATAC CGATGTCGCC 
AGCGCCATTA CCAAATTGAA TCAAAGCTAC CTCAATTTAC AGGCGACCCA GCAGAGCATG 
GTGAAAATCC AAAGTCTGTC CCTGTTTAAC TATATTCGTT GA

Protein sequence

MRVSTSMVFA QGLSNLQQQQ SAMLQSQQEI ATGVKLTNPA QDPVAFSTAS DLSVLNSKQN 
QYSTNIDNAT GKIQVQESTL GSITTMLQSV RDVAIQANNA AQNGMSLSAL TDQLDQLQKA 
LAGQMNATDE RGEYLFSGTV AREKPYDASG QLNPALDSTS PSFQNVTSVK LAISDQQSVA 
INQPAGQIFQ LSSSATTGGN ASILQVIDQL KTAITTQPAN LQTIYQNAQK DIDAVMNQVT 
DARGSMGNAL NTLSTAKNDN AAQNVLTQQT LSGLRDTDVA SAITKLNQSY LNLQATQQSM 
VKIQSLSLFN YIR