Gene Noc_2368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2368
Symbol
ID	3704808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2714796
End bp	2715998
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	52%
IMG OID	637738851
Product	flagellin-like
Protein accession	YP_344356
Protein GI	77165831
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID	[TIGR02550] flagellar hook-associated protein 3

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATCT CCACTTCTTT ATTTCAGCAA CAAAGCATTG ATGGGATGCT TCGCCAGCAA 
GCCCAGGTAA GTAAAACCCA GCAGCAAATA GCCAGTGGCG AGCGTATGCA AACGCCGGCC 
GATGATCCTA TTGCGGCCGC CCGCTTGCTA GAAGTCCGTG AAGCTTCCGG GAGAACCGCC 
CAGTTTCAAA CAAACGCTGA CCGGGCGACA GCCCGTTTGT CCCAAGAGGA AAATGCCCTG 
GCGGGAGTTA ATAATGTATT GCAGGGAGTG CGGGAGCTGG CGGTGCAGGC CAATAATGGC 
GCTCAAAACA ATGAGAATCG GGCTATCATT GCCCAAGAGG TTCGGCAGCG CCTCAACGAA 
CTGGTAGGGC TGGCGAATAG TCAAGATGCC AGTGGCGAAT ATCTTTTTGC TGGCGCTAAG 
GGTCGCTCCC AGCCTTTTAT TCAAGAAGGG GGAAGCGTTT CTTATCAGGG GGATCAGGCC 
CAGCGTCTGA TCTCTATTGG CCCTTCGGTG CAAGTGGCGG ATAGTCACTC TGGCTCCGAG 
GTGTTTTTAG CCATCCGCGA GGGTAATGGC GTTTTTGCCA CCGAAGCGAA CCCTTCAAAT 
ACGGGTTCAG GAGTGATTGC GCCCGGTTCG GTCAATGGAG CTTTCATTCC TGACAATTAT 
ACCCTGCAAT TTTCCCAGGC GACGCCTGAT GATCCCCTTA CCTACCAAGT GTTGGACTCC 
CAGAATACTG TTGTGGCTAA TGGTGGTTTC GCTAGCGGGG AAGAGATTAC TTTTGGCGGT 
GCCCAGGTAA GTATTACCGG CATTCCCGCG GATGGAGACA GTTTCACCCT CCATGCAAGT 
GCTCACCGGG ATATGTTCAC TATCGCCCAG CATTTTATTG AGGCTCTGGA GCGGCCAATA 
AATGATACGG CCAGCCAGGC TCGATTTCAT AATGATATGA ACAGGGCCCT CACCGATCTG 
GATCAAGCCA TGGGCAAGAT TTTGGAAGTC CGGACAGAGG TGGGTACTCG CCTTAATGCC 
GTCGATAGGG AACGCCAAGT AAATGAAGAG GCTAGCTTGC AATTGGCTAG GGAGCAATCT 
TCGCTTAATG ATCTGGATTT GGCTGAAGCT ATTGGGCGCT TGAACCAGCA GTTAACGGGA 
CTTGAGGCCG CCCAGCGGAC TTACGCCCGT TTGCAGGGAT TATCCTTGTT TAATTTTCTA 
TAA

Protein sequence

MRISTSLFQQ QSIDGMLRQQ AQVSKTQQQI ASGERMQTPA DDPIAAARLL EVREASGRTA 
QFQTNADRAT ARLSQEENAL AGVNNVLQGV RELAVQANNG AQNNENRAII AQEVRQRLNE 
LVGLANSQDA SGEYLFAGAK GRSQPFIQEG GSVSYQGDQA QRLISIGPSV QVADSHSGSE 
VFLAIREGNG VFATEANPSN TGSGVIAPGS VNGAFIPDNY TLQFSQATPD DPLTYQVLDS 
QNTVVANGGF ASGEEITFGG AQVSITGIPA DGDSFTLHAS AHRDMFTIAQ HFIEALERPI 
NDTASQARFH NDMNRALTDL DQAMGKILEV RTEVGTRLNA VDRERQVNEE ASLQLAREQS 
SLNDLDLAEA IGRLNQQLTG LEAAQRTYAR LQGLSLFNFL