Gene Noc_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2159
Symbol
ID	3704833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2494696
End bp	2495829
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	53%
IMG OID	637738635
Product	flagellar biosynthetic protein FlhB
Protein accession	YP_344149
Protein GI	77165624
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1377] Flagellar biosynthesis pathway, component FlhB
TIGRFAM ID	[TIGR00328] flagellar biosynthetic protein FlhB

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGACT CTAGTGCTCA GGAGCGCACG GAACAACCGA CTCCAAAGCG CCAGGAAGAG 
GCTCGAAAAA AAGGCCAGGT TCCCCGTTCA CGGGAACTTA GCACGACAGT TTTGCTGCTG 
AGCTCCGCCC TGGGGCTGGT GTTGATAGGG GAGCCTTTGC TGCAGGGGCT AGCCGATCTA 
ATGCGCCAGG GTTTGCAGTT GGAACGCGCC CAGATTTTTG AGCCGAAGGC CGCTATTCTA 
CAGTTTCAGC AAGGAGTAGG TGAAGCGGTC AAAATAATAA CGCCTTTTTT GGCTTTAACA 
CTTATCGCGG CGTTGGCCGC CCCTCTTTTA ATGGGGGGTT GGAGTTTTAG CGCTCAGTCC 
TTGGGTTTTA AGTGGGAGAA ACTAAATCCG GCCAAGGGCA TGAAGCGAAT TTTTGGCCCT 
CAAGGCGGAA TGGAACTACT CAAGGCATTG ATTAAATTCT TGCTTCTAAG TGGTGTAGGT 
TGTCTACTGT TTTGGCTTTT TAGTCCCGAT TTGATCGCTC TGGGAAGGCA ACCGTTTGTT 
CCAGCCGTAT TTCAATTAGC CCACTTGATG GGATGGAGTT TAGTGGGCCT TTCCGCCAGT 
CTTGCGCTTA TCGCGGTGAT CGATGCTCCC TTTCAAGGAT GGAATCATAC CCGCCAGCTC 
AAGATGACGC GGCAGGAGGT CAAAGAGGAA CATAAAGAAA CTGATGGCAA CCCGGAGCTC 
AAGGGGCGGA TTCGTCGTGT TCAACGGGAA ATAGCAAGCC GCCGCATGAT GGCGGCGGTT 
CCCCAGGCCG ATGTGGTGGT GGTCAACCCT ACCCATTACG CGGTAGCCCT GAATTACGAG 
CAGGATAAAC AGGGTGCCCC GCGAGTAGTT GCTAAGGGGG TTGATCAGGT GGCCATCAAA 
ATTCGAACGG TAGCGGCAGG TAATAACGTA CCCGTACTTT CCGCACCGGC TTTGAGCCGT 
GCCATTTACC ACAGTACCAA GCTAGACCAA GAAATTCCCG CCGGACTTTA CCGTGCTGTG 
GCGCAGGTGC TGGCTTATGT CTTGCAACTG CGCCAGTACC AACGCCGGGG TGGCCCCCGG 
CCCCAACCTA TTCCAAATGA ATTTCCAATT CCTGAAGACT TAAGACGGGA TTAA

Protein sequence

MADSSAQERT EQPTPKRQEE ARKKGQVPRS RELSTTVLLL SSALGLVLIG EPLLQGLADL 
MRQGLQLERA QIFEPKAAIL QFQQGVGEAV KIITPFLALT LIAALAAPLL MGGWSFSAQS 
LGFKWEKLNP AKGMKRIFGP QGGMELLKAL IKFLLLSGVG CLLFWLFSPD LIALGRQPFV 
PAVFQLAHLM GWSLVGLSAS LALIAVIDAP FQGWNHTRQL KMTRQEVKEE HKETDGNPEL 
KGRIRRVQRE IASRRMMAAV PQADVVVVNP THYAVALNYE QDKQGAPRVV AKGVDQVAIK 
IRTVAAGNNV PVLSAPALSR AIYHSTKLDQ EIPAGLYRAV AQVLAYVLQL RQYQRRGGPR 
PQPIPNEFPI PEDLRRD