Gene Noc_2367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2367
Symbol
ID	3704807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2712931
End bp	2714409
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	54%
IMG OID	637738850
Product	flagellin
Protein accession	YP_344355
Protein GI	77165830
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.912497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCAGA CTATCAATAC CAATATTGCC TCACTTAATG CCCAGCGGAA TTTGAATAGC 
TCCCAAGGTG CGCTGCAGAC TTCACTAGAA CGTCTGTCCA GCGGTTTTCG GATTAACAAC 
GCCAAGGATG ATGCTGCCGG GCTGGCGATT ACGGAGCGGA TGACCTCCCA GATTCGTGGC 
CTTGCTCAGG CGACCCGTAA TGCGAATGAC GCTATTTCTG TGACCCAAAC CGCTGAGGGG 
GGCTTGAAGG AGAGCAGCAA TATCCTGCAA CGGATGCGGG AGCTTGCCGT CCAGTCTGCT 
AATGATACCA ACAGTGACTC GGATCGGGCC AATCTGCAAA AGGAGGTATC GCAACTACAG 
TCGGAACTCA ACCGACTTGC GGATTCCACT ACTTTTAATG GTAAAAATCT ATTGGATGGT 
TCCTTTACGG GACAGAAATT CCAAATTGGC GCCAATGCTA ACGAAAGCAT TGGTTTTTCC 
ATTAATAGCG CCCGCGCCAC GACTCTTGGG GAGCAGCTAG GAAAGAGTAT TACCAATGTA 
GGTGCGGGTC TAGCCGTAGC GGCGGATACC TCAGGCGGTA ATACCGTAGC TGCCCAGAAT 
ATAACCGTCA ATGGTTCCAC GGGCTCTAAG ATGGTAGCGC TTACAGGCAA CGAGAGTGCC 
AAGGCGATAG CTGATTTGGT CAATGAACAA TCCGGGAGTA CCGGCGTGAC GGCCTCCGCC 
CAGACTTCGG TGACCCTAGA CAACGTGGCG GCCGATGGCA CGGTCTCTTT TACCCTCCAG 
TCCAGCGGCG GCGGCTCGGC GGCGGCGATT TCCGCAGGGG TCACCACCAC TGATCTGACC 
AATTTGGCCG ATGCCGTCAA TGCTCAAAGC GCCGAGACTG GCGTGACCGC CACGCTCAGC 
GAAAACCGGG ACGCCATTAC CCTGGAAAAT GCCGAAGGCG AGGATATTTT GGTCTCGGAT 
GCGGATAATA CGGGGGTCGC GGCAGCCGCG GCGGCATTTG ATACAGGGGG ACAGAGTTTA 
ATCAAAACCG ATGGGGCCAC CGGTACGGCA AATGATAGTA TTGTGGTGGG TGGCCAAGTA 
AGCTTCCAGT CCGATAAAAG CTTTACCACA ACCAGCGATA CCGGCAATAC GGTGGTGGGA 
GCGGGTGGCG TGACCTCCGC CTTATCTTCG GTGGCCCAAA TCGATCTCTC CAGCCAGGAC 
GGTTCCAACA GCGCCCTGTC CGTTATCGAT AAAGCTCTGG GTTCAATCGC TACCCAGCGG 
GCAGATTTAG GTGCCCTGCA AAATCGTTTT GAGTCTACTA TTTCTAATTT ACAGAATGTT 
TCCGAGAATA CTTCTGCTGC CCGTTCCCGC ATCCGGGATG CGGATTTTGC TTCCGAGACG 
GCTGAAATGA CCCGCAATCA GATTCTCCAG CAGGCAGGTA CCGCTATGCT GGCACAGGCG 
AATTCCCTGC CTCAGGGGGT TTTGAGCTTG TTGAGATAG

Protein sequence

MAQTINTNIA SLNAQRNLNS SQGALQTSLE RLSSGFRINN AKDDAAGLAI TERMTSQIRG 
LAQATRNAND AISVTQTAEG GLKESSNILQ RMRELAVQSA NDTNSDSDRA NLQKEVSQLQ 
SELNRLADST TFNGKNLLDG SFTGQKFQIG ANANESIGFS INSARATTLG EQLGKSITNV 
GAGLAVAADT SGGNTVAAQN ITVNGSTGSK MVALTGNESA KAIADLVNEQ SGSTGVTASA 
QTSVTLDNVA ADGTVSFTLQ SSGGGSAAAI SAGVTTTDLT NLADAVNAQS AETGVTATLS 
ENRDAITLEN AEGEDILVSD ADNTGVAAAA AAFDTGGQSL IKTDGATGTA NDSIVVGGQV 
SFQSDKSFTT TSDTGNTVVG AGGVTSALSS VAQIDLSSQD GSNSALSVID KALGSIATQR 
ADLGALQNRF ESTISNLQNV SENTSAARSR IRDADFASET AEMTRNQILQ QAGTAMLAQA 
NSLPQGVLSL LR