Gene Noc_2369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2369
Symbol
ID	3704809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2716002
End bp	2717945
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	55%
IMG OID	637738852
Product	hypothetical protein
Protein accession	YP_344357
Protein GI	77165832
COG category	[N] Cell motility
COG ID	[COG1256] Flagellar hook-associated protein
TIGRFAM ID	[TIGR02492] flagellar hook-associated protein FlgK

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCAA GCGATCTTTT AGGAATAGGT GCTTCCGGGC TTTTAGCCGC GCAGCGGGCC 
CTGGCCACAA CTAGTCATAA TATTGCCAAT GTGAATACGC CGGGTTTTTC TCGGCAACGG 
ACGGAACTGG CTGCCCGCTT GCCCGAGTTT ACCGGGCAGG GATTTATCGG TACCGGGGTG 
GATGTCACCA CAGTGCGCCG CGCCTACGAT TCTTTTCTGA CCGAGCAGGC GCGGTACTCC 
ACTTCGGAGT ATGCTCAATC CAAGGTTTTC CATGATCTAG CAGCCCAGGT AGATAATCTT 
TTTGCGGATT CTGACACGGG GCTCTCTGCT TCTTCGCAGC GATTTTTTAA TGCCACGCAG 
GAGTTGGCAA ACGATCCCTC CAGTTCGGCG GCACGCCAGG TGCTGCTTGC CGAGGGTGGG 
GCCTTTGCGG CCCGTGTTCA TTCTCTCGGT GACCGGTTGG GTGAACTGGA CGAGGATGTC 
AATACCCGGT TGCGCGATAC TGTTGCGGAA GTGAATACGC TCTCTTCCTC CATTGCCGGG 
CTCAATCAGC AAATCCGCGA CCTGCGTGGG CAAAATAATA ACCAGCCGCC TAACGATTTA 
CTGGATCAAC GGGATCAGTT AATTCAAGAT CTTTCCCAAA AAGCAGCGGT CACCGTGCTT 
CCCCAGGACG ATGGCAGCCT CAACGTTTTT ATTGGTAAAG GGCAATCCCT GGTAACAGGA 
GACCACAGCC ATTCCCTAAC CACTTTGGCC AACCCCTATG AGGCATCCCG CCTGGAAGTG 
GGTTATGCTG CCAAGGGCGG GGTTGCCCCC ATTTCTGACT CTATTCAGGG CGGTGAATTA 
GGGGCTCTGT TGAGCTTCCG CGATGAAGTT TTGTCGTCTT CCCGCAATGC TTTGGGGCAA 
CTAGCGGTGG GAGTCGCCCA ATCCTTCAAC GAGCAGCACC GCCTGGGGGT GGACCTTCAG 
GGAGAACTCG GTGGCGATTT TTTTGCTGCC ATCGATTCCA ATACGGCGGT TTCGTTGCCA 
CGCGCTGATA ATACTGGCGA TGGCGTTATC GAAATCGCTA TTAACGATGC CAGCAAGCTG 
ACCGATAGCG ATTATCGCTT GGACCGGAAT GGGGCGGGGT TTACCCTGAC CCGGCTGTCG 
GATAATCAAG CTTTCTCCTT AAGTACCTTT CCCGGCAGCG CGGAAACTGT CGATGGGCTG 
ACCTTAAATT TAACCTCTGG CTCCATTAAT GGGGGCGATA GCTATCTGAT TCAGCCTACC 
CGGGCGGCGG CGCAACAGTT TGGGGTGATG CTTACCGATT CTGCCCGCAT TGCCGCCGCA 
GGACCCATCC GTACCGAGGC AAACCTTGGC AACAGAGGCA CGGGGCAAGT TTCAGCCGCT 
GCGGTAACCG CTACTGCCGG CCTTCCCTTG CCGTCTAATG GAGAGGTGAC CTTGACCTAT 
GACGCCGCAG CGCGGCAGTT CAATGTAAGC GGCGGTCCAG GAGGGACCCT GGATTTCGAT 
CCGGCTACCG AAAGTAATGG CAAGGAATTT CATCTCCCCA GCGTGGGGGG ACTGAATTTT 
ACGGTTTCCG GAGTTCCCGC GGATGGGGAT ACCTTTATGC TCCAGAATAA TACAGGGGGC 
GTTGGGGATA ACCGTAACGC CCTCAGCCTT GCTGGATTAC AAACCAAGCC TGTTTTTCAG 
GACGGTACAA CGACCTACCA GGAGCAGTAT GGTCGCTTGG TGGCGGATGT GGGCGCCCGC 
ACCCGCCAAG CGGAAGCAAA CCAGGATACC CATAAAACCT TACTTGATCA AGCTGTTGCA 
GCAAGAGAAG GGGTATCGGG AGTGAACCTG GAAGAGGAAG CGGCGAATTT AATCCGCTTC 
CAGCAGGCTT TTCAAGCCGC CGCCCGGGTG ATCTCAACCG CCGATACCAT GTTTCAGACT 
TTATTAGGCG CGGTAGGTAG ATAA

Protein sequence

MASSDLLGIG ASGLLAAQRA LATTSHNIAN VNTPGFSRQR TELAARLPEF TGQGFIGTGV 
DVTTVRRAYD SFLTEQARYS TSEYAQSKVF HDLAAQVDNL FADSDTGLSA SSQRFFNATQ 
ELANDPSSSA ARQVLLAEGG AFAARVHSLG DRLGELDEDV NTRLRDTVAE VNTLSSSIAG 
LNQQIRDLRG QNNNQPPNDL LDQRDQLIQD LSQKAAVTVL PQDDGSLNVF IGKGQSLVTG 
DHSHSLTTLA NPYEASRLEV GYAAKGGVAP ISDSIQGGEL GALLSFRDEV LSSSRNALGQ 
LAVGVAQSFN EQHRLGVDLQ GELGGDFFAA IDSNTAVSLP RADNTGDGVI EIAINDASKL 
TDSDYRLDRN GAGFTLTRLS DNQAFSLSTF PGSAETVDGL TLNLTSGSIN GGDSYLIQPT 
RAAAQQFGVM LTDSARIAAA GPIRTEANLG NRGTGQVSAA AVTATAGLPL PSNGEVTLTY 
DAAARQFNVS GGPGGTLDFD PATESNGKEF HLPSVGGLNF TVSGVPADGD TFMLQNNTGG 
VGDNRNALSL AGLQTKPVFQ DGTTTYQEQY GRLVADVGAR TRQAEANQDT HKTLLDQAVA 
AREGVSGVNL EEEAANLIRF QQAFQAAARV ISTADTMFQT LLGAVGR