Gene Noc_2240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2240
Symbol
ID	3704913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	2586716
End bp	2587936
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	57%
IMG OID	637738715
Product	Phage integrase
Protein accession	YP_344228
Protein GI	77165703
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCCG CACCACAGAG AACCAAGCTT ACCAAGACGG TCGTTGATCG CCTGCCCGCG 
CCTACGAGGG GCCAAGCTTT CTATTGGGAC AGCGCGCTAC CCTGCTTTGG CGTGCGGGTA 
TCGGCGGGAG GCGTGAAGTC ATTTGTTATT CAAAAGCGCA TTCAAGGCCG GGAGAAACGA 
ATCACGCTAG GCAAGTACGG CCATTTAACA CTCATGCAGG CCCGCAAGGA GGCCGCGCGG 
CTGTTAGGGG AAATTGCCGT AGGACGCAAC CCATTAGCTG AGAAGGCGCA AGCAAAACTA 
CGGGCCGTGA CGCTCGGCGA GGCGCTTGAG CACTATCTAA CCTCAAGGCC ACTGAAAGCG 
CGCACCATTC AGGGAACGCG GCACACCATG GGAAAGTGCT TTAGTGACTG GATGAAGCGC 
CCCCTGACAA GCATTACCAG GGATAAAGTC GCCGCCAGGC ATAAGCAGCT AGGCACCGCT 
AGCAAGTCCC ACGCTAACTT AGCTATGCGG TATTTAAGGG CTGTCTTCAA CTTCGCCATG 
GCGGACTATA CCGATAACGA AGGCCGCCCT GTGATTGCGG ATAACCCCGT CAACCGCTTG 
TCCGAGGCTA GAACCTGGTT CCGGGTAGAG CGCAGGCGCA CGGTGATAAA GTCCCACGAG 
TTAAAGCCCT GGATGCAGGC CGTACAGAGG CTAGAGAATG GGGCAGCCCG TGACTACTTT 
ATGTTGGTAT TGCTAACGGG CCTTCGACGC ACCGAGGCGC TTAATTTACG CTGGCAGAAC 
GTGGACTTAG TCGCTAACAC CCTTACAGTC CAGGACACCA AGAACCACCA GGCCCACACC 
CTGCCCCTAT CCGACTACCT GACGGAGATG CTAGCGGCAC GGCTAGAGGA TACCTATAGC 
GAGTATGTGT TCAGCACCTC CAGGGGACGG CTTTCCAACC TGAGAGGCCC GCTTGCTGAG 
GTAAGGAGCT ATGCGGGTAT ATCGTTTTCT ATCCATGACT TAAGGCGCAC CTTCGCCACT 
GTGGCGGACT CCCTGGATGT GCCAGGCTAC GCCGTTAAAG CACTCCTTAA CCATAAGGCG 
GCTAATGATG TGACGGCGGG CTATATCGTG GTGGATACGG AAAGGCTACG CGCCCCCATG 
CAGAAGATTA CCGACTTTAT GTTAAGGGCA GGCGGCTTAT GGGAAGGGGG CGAAGTGGTG 
GAGCTTAGGC AGTACGGATG A

Protein sequence

MKPAPQRTKL TKTVVDRLPA PTRGQAFYWD SALPCFGVRV SAGGVKSFVI QKRIQGREKR 
ITLGKYGHLT LMQARKEAAR LLGEIAVGRN PLAEKAQAKL RAVTLGEALE HYLTSRPLKA 
RTIQGTRHTM GKCFSDWMKR PLTSITRDKV AARHKQLGTA SKSHANLAMR YLRAVFNFAM 
ADYTDNEGRP VIADNPVNRL SEARTWFRVE RRRTVIKSHE LKPWMQAVQR LENGAARDYF 
MLVLLTGLRR TEALNLRWQN VDLVANTLTV QDTKNHQAHT LPLSDYLTEM LAARLEDTYS 
EYVFSTSRGR LSNLRGPLAE VRSYAGISFS IHDLRRTFAT VADSLDVPGY AVKALLNHKA 
ANDVTAGYIV VDTERLRAPM QKITDFMLRA GGLWEGGEVV ELRQYG