Gene Noc_2272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2272
Symbol
ID	3705064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2618951
End bp	2619979
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	52%
IMG OID	637738751
Product	type IV pilus assembly protein PilW
Protein accession	YP_344260
Protein GI	77165735
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4966] Tfp pilus assembly protein PilW
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGCC CATCTTACTA CTTACCTTCA AGCCGCGCGC AACGGGGTTT CTCACTAGTT 
GAGATTTTAG CGGGGATGAC CGCGGGCTTG ATACTCACTA CGGGGGTTAT TCAAGTCTTT 
TCCAGTAGCA AACAAAGCTA CCGGCTTCAG GAAGCGCTCT CCCGACTCCA GGAGAACGGC 
CGCTTTGCCG TAGAGTTTAT CTCTTACGAG GCCCGCAATG CCGGCTACTT TGGCTGCGCT 
GGAACCGAAA CCCGGGTAGT TAATACCCTC AATAATGCTG AACAATTTGC TTGGGATTTT 
TCTACTCCCC TGCAAGGTTT TGAGGCCACC AGCGCCAGCA GCTGGACGCC TGCCCTAGAC 
GCTACCATCA CCCAACCCCT TGGTAACCGG GATGTGTTGA CCTTCCGTCA TACTTCCGGC 
AACCTGGCCA AAGTTGAACC GCCCTTCATG CCTACTACCT CCGCGGCGCT CCACATAACG 
CCTGATAACG GGCTCAAGAA ATCCGATATT GTCATGGTTT CCGACTGTGT CGATGCAGCC 
ATTCTTCAAG TAACCAATGC TAACCCAGAC ACCTCCGGCA CTTTAGTCCA TAACACCGGC 
AACGGGGTCA CCCCCGGCAA CGCCACTAAA GATCTGGGAA AAAGATATAC CGACAAGGCT 
AATATTATCC AAATCACCAC CAGCACCTAC TACATTCGCG CTAATCCGCG AGGCGTTCCC 
TCCCTTTATA GGAAAGAGAG CGACGACAAC CCGCAAGAAC TCATCGAAGG CGTGGAGGAT 
ATGCAAATTC TCTACGGCGA AGATACGGAT GGCAGCCAGG AGGCCAATGG TTATGTGACT 
GCGGATAACG TGGCCAATTG GAATAATGTG GTCAGCCTAC GTCTCAATTT TCTGTTGCAA 
ACCATGGAAA ATAATCTCGC CTCCTCTCCC CAATCCTATA CCTTTAATGG CGCCACCATA 
ACTCCCAGCG ACAGGCGGCT GCGCCGGGTA TTCACCACAA CCCTGAATTT GAGGAATAGA 
ACGTTATGA

Protein sequence

MKRPSYYLPS SRAQRGFSLV EILAGMTAGL ILTTGVIQVF SSSKQSYRLQ EALSRLQENG 
RFAVEFISYE ARNAGYFGCA GTETRVVNTL NNAEQFAWDF STPLQGFEAT SASSWTPALD 
ATITQPLGNR DVLTFRHTSG NLAKVEPPFM PTTSAALHIT PDNGLKKSDI VMVSDCVDAA 
ILQVTNANPD TSGTLVHNTG NGVTPGNATK DLGKRYTDKA NIIQITTSTY YIRANPRGVP 
SLYRKESDDN PQELIEGVED MQILYGEDTD GSQEANGYVT ADNVANWNNV VSLRLNFLLQ 
TMENNLASSP QSYTFNGATI TPSDRRLRRV FTTTLNLRNR TL