Gene Noc_2686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2686
Symbol
ID	3704443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3041767
End bp	3042885
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	50%
IMG OID	637739168
Product	transposase
Protein accession	YP_344669
Protein GI	77166144
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.442816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACAA CGCTCCAAAT CAAATTGCTT CCTGATGGAA CTCAGCACTC GGCCCTGAAA 
GAGACCATGC GGGTTTTTAA TGACGCTTGT AACGCCATTG CAGAAGTGGC TTTTAGAGAA 
CAGTGCGCCT CTAAATTTGA GTTGCAAAAA CTTGTGTATG CGGATGTTAG GAAGCAGTTT 
GGTTTGTCGG CCCAATTGAC TATTCGCGCC ATCGCCAAAG TCGTTGAAGC TTACAAGCGA 
GATAAATCCA AGCAGTGCTT CTTTAAGCCG ACGGGTGCCG TGGTGTATGA CCAGCGCATA 
CTGAGCTTTA AGGGTTTGGA TAGAGCCAGC CTTGTAACGA TGCAAGGGCG CGTGTCTATT 
CCTATACAGA TGGGCCAATA CCAGCGCGTA CAATGGCATC GTGCCAAAGG ACAGGCCGAC 
CTGGTGCTTG TGAAGGGTGC TTTCTTTTTG TTGGTCGTCA TCGACACACC CGAAGCACCC 
CCCATAGACC CGTCTGGTTT TATTGGTATT GATCTTGGAA TTACCAAAGT GGCCACTGAT 
TCCGATGGCG GGTCGTTCTG TGGTTCTACC GTGGAGCGTG TGCGCCAGCG CTACCACCGT 
TTGCGTAGGC GACTGCAGTC TAAGGGCACG CGCTCGGCTA AGCGGCATTT GAAGAAAATT 
CGACGCAAGG AAGCGCAGTT TCGAAGAAGT CAAAATCATA TTATTTCTAA GCGTCTTGTC 
GAGAAAGCTA AAGACACCGG ACGCGGAATT GCTTTGGAAG AGTTGAAGCA TATCCGCAGC 
CGGACAACGG TTCGGAAATC CGACAGGGCC AAGCACAGCG GTTGGTCGTT CTTTCAACTT 
CAATCCTTTA TCGAATATAA GGCGAAGCTT GCGGGTGTCT TTGTTCAATA TATTGACCCC 
TGGTATACCT CGCGCACCTG TAGCGCCTGC GGGCATGCCG ATAAAGCTAA CCGCAAAACC 
CAATCCCACT TTCAATGTGT CTCTTGTGGA TACACTGATA ATGCGGATAT CAATGCGGCG 
ATCAATATTG CTGCAAGGGC TGACGTCATG CAGCCTATGG TGATGCGTGC GACGACGGCA 
AAGGATAGCC CGAGCACAGC TACAAGCCTC CCCCTTTAG

Protein sequence

MKTTLQIKLL PDGTQHSALK ETMRVFNDAC NAIAEVAFRE QCASKFELQK LVYADVRKQF 
GLSAQLTIRA IAKVVEAYKR DKSKQCFFKP TGAVVYDQRI LSFKGLDRAS LVTMQGRVSI 
PIQMGQYQRV QWHRAKGQAD LVLVKGAFFL LVVIDTPEAP PIDPSGFIGI DLGITKVATD 
SDGGSFCGST VERVRQRYHR LRRRLQSKGT RSAKRHLKKI RRKEAQFRRS QNHIISKRLV 
EKAKDTGRGI ALEELKHIRS RTTVRKSDRA KHSGWSFFQL QSFIEYKAKL AGVFVQYIDP 
WYTSRTCSAC GHADKANRKT QSHFQCVSCG YTDNADINAA INIAARADVM QPMVMRATTA 
KDSPSTATSL PL