Gene Noc_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0442
Symbol
ID	3706613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	478400
End bp	479554
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	55%
IMG OID	637736952
Product	transposase
Protein accession	YP_342496
Protein GI	77163971
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000469255
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAATAC AATGCGCCTA CAAGTTCAGG TTTTACCCAA CGCCCACGCA AAAGCGGCAA 
TTGGCCCTTG AGTTTGGCCA TGCCCGTTAT GTGTGGAATT GGGCCTTGGA AACCCGAACG 
AAGGCGTATC AAGCGCAGGG GGAGTCGTCG AATACTATAA GTCTTAGTCG CCAATTGACG 
GCACTGAAAA AGACGCAATG CCCCTGGTTG AGCGAAGCCA CCGCTAGTTG CCATACCCAA 
AAGCTCAGGG ACCAAGATAC GGCCTTCAGG AACTTTTTCG CAGGTCGAGC GAAGTATCCC 
CGCTTTAAGA AGCGCCACCA CACGCAATCG GTACGCTATC AGTTGGACCA ACGCCATGTG 
GCGAAGAACT TCAACGCTGA AAGCAAGCTG TTGAAGCTGC CCAAGCTTGG CAGAGTTAAG 
TTGAGATGGT CCCGTGGTAT CGAGGGCATC CCCAAGATGG TCACGGTCAG CCAAGCCCCG 
GCGGGCCGTT ACTTCGTTAG CCTGACCTGC GAGGTGGAGA TTCTCCCCTT GCCTGTGCGA 
AGGAACGCTA TCGGCGTGGA TGTGGGGGTT AAGGATGTGG TCATTACTTC CGAAGGCTGG 
AAGTCGGGTG CGCCCAAATA CACCTATCAC TATGCCCGGC AATTGAAAAT GGCCCAGCGT 
CGCCTGAGCA AAAAAAAGAA AGGCTCTCAG CGTCGCCGCC AGCAGCAACA GCGGGTAGCG 
CGCATCCATG CCCGGATAAC CGATAGCCGC CGGGATTTTT TGCACCAACA ATCCTCCAAG 
ATAGTCAACG AGAACCAAGT GATCTGCCTG GAGGATTTGA ATATCCAAGG GATGTTGAGA 
AACCGACGCC TGAGTAAAGC CATAGCTGAT TGCGGGCTGT ATGAGCTCAG ACGGCAAATG 
GAGTACAAGG CCGCCTGGTA TGGCCGGGAG GTGTTGATCG TGGACCGCTG GGCACCCACC 
AGCAAGACGT GCTCGGCGTG TGGGGCTGTG CAAGAGTCCA TGCCGCTCAA AGTGCGCGCA 
TGGGCTTGTG AATGTGGGGC CACCCACGAT AGGGACATCA ACGCAGCCAA AAATATTTTG 
TTTTTCGGTA CGGCGGGGAG CGCCGGAACC TCTAAAGCGC GTGGAGCGGT AAAACCCCCA 
AGGGCCGTGG CCTAG

Protein sequence

MIIQCAYKFR FYPTPTQKRQ LALEFGHARY VWNWALETRT KAYQAQGESS NTISLSRQLT 
ALKKTQCPWL SEATASCHTQ KLRDQDTAFR NFFAGRAKYP RFKKRHHTQS VRYQLDQRHV 
AKNFNAESKL LKLPKLGRVK LRWSRGIEGI PKMVTVSQAP AGRYFVSLTC EVEILPLPVR 
RNAIGVDVGV KDVVITSEGW KSGAPKYTYH YARQLKMAQR RLSKKKKGSQ RRRQQQQRVA 
RIHARITDSR RDFLHQQSSK IVNENQVICL EDLNIQGMLR NRRLSKAIAD CGLYELRRQM 
EYKAAWYGRE VLIVDRWAPT SKTCSACGAV QESMPLKVRA WACECGATHD RDINAAKNIL 
FFGTAGSAGT SKARGAVKPP RAVA