Gene Noc_0166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0166
Symbol
ID	3706199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	183948
End bp	185312
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	637736683
Product	TPR repeat-containing protein
Protein accession	YP_342229
Protein GI	77163704
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0362369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCC AAGGACGACT CGATGTGCTA CAGAAGAAAG CTAAGGCAGC ATTAGCAATT 
CGACACTACA AAGAGGCAGA ATCCCTATTA CAAGAGTTAT TAGAAACCCA AGTCCAGCAC 
TTTGGTGATG CAGACACGCA GATCGCCACC ACACTGAACA ATCTCGCAGC TCTTTATGAA 
GCCCAAGGGC GGTATGCTCA GGCCGAGGAG CTTTACCATC GCTCGCTTGC TATCCGCGAA 
CAGTTGCTAG GCCCGGACCA CCCCGAGGTT GCCACCACAC TGAACAATCT CGCAGCTCTT 
TATGAAGCCC AAGGGCGGTA TGCTCAGGCC GAGGAGCTTT ACCATCGCTC GCTTGCTATC 
CGCGAACAGT TGCTAGGCCC GGACCACCCC GAGGTTGCCA CCACACTGAA CAATCTCGCA 
GCTCTTTATG AAGCCCAAGG GCGGTATGCT CAGGCCGAGG AGCTTTACCA TCGCTCGCTT 
GCTATCCGCG AACAGTTGCT AGGCCCGGAC CACCCCGAGG TTGCCACCAC ACTGAACAAT 
CTCGCGGCGC TCTATAAGAA ACAAGGGAGG TACGCTCAGG CCGAGGAGCT TTACCATCGC 
TCGCTTGCTA TCCGCGAACA GTTGCTAGGC CCGGACCACC CCGAGGTTGC CACCACACTG 
AACAATCTCG CAGCTCTTTA TGAAGCCCAA GGGCGGTATG CTCAGGCCGA GGAGCTTTAC 
CATCGCTCGC TTGCTATCCG CGAACAGTTG CTAGGCCCGG ACCACCCCGA GGTTGCCACC 
ACACTGAACA ATCTCGCAGC TCTTTATGAA GCCCAAGGGC GGTATGCTCA GGCCGAGGAG 
CTTTACCATC GCTCGCTTGC TATCCGCGAA CAGTTGCTAG GCCCGGACCA CCCCGAGGTT 
GCCACCACAC TGAACAATCT CGCGGCGCTC TATAAGAAAC AAGGGAGGTA CGCTCAGGCC 
GAGGAGCTTT ACCATCGCTC GCTTGCTATC CGCGAACAGT TGCTAGGCCC GGACCACCCC 
GAGGTTGCCA CCACACTGAA CAATCTCGCA GCTCTTTATG AAGCCCAAGG GCGGTATGCT 
CAGGCCGAGG AGCTTTACCA TCGCTCGCTT GCTATCCGCG AACAGTTGCT AGGCCCGGAC 
CACCCCGAGG TTGCAATCAT GCTAAATAAT CTTGCTGGCT TGTACAGGGC GACGGGATTG 
GGTGAGAAAG CAGAAAGTTT GTATGACAGA AGCTTGGCGG TAATGGAAAA AATATTCGGG 
CCAAGACATC CAAATACTGC AATCGTACGA GCCAACCGCG ATGCTTATAA ACATACGGCA 
CCTAACAAGG CAAATTCAGC CGACGCCAAA AAGCGGCGCG GCTGA

Protein sequence

MKLQGRLDVL QKKAKAALAI RHYKEAESLL QELLETQVQH FGDADTQIAT TLNNLAALYE 
AQGRYAQAEE LYHRSLAIRE QLLGPDHPEV ATTLNNLAAL YEAQGRYAQA EELYHRSLAI 
REQLLGPDHP EVATTLNNLA ALYEAQGRYA QAEELYHRSL AIREQLLGPD HPEVATTLNN 
LAALYKKQGR YAQAEELYHR SLAIREQLLG PDHPEVATTL NNLAALYEAQ GRYAQAEELY 
HRSLAIREQL LGPDHPEVAT TLNNLAALYE AQGRYAQAEE LYHRSLAIRE QLLGPDHPEV 
ATTLNNLAAL YKKQGRYAQA EELYHRSLAI REQLLGPDHP EVATTLNNLA ALYEAQGRYA 
QAEELYHRSL AIREQLLGPD HPEVAIMLNN LAGLYRATGL GEKAESLYDR SLAVMEKIFG 
PRHPNTAIVR ANRDAYKHTA PNKANSADAK KRRG