Gene Noc_1184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1184
Symbol
ID	3706758
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1291596
End bp	1292567
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	55%
IMG OID	637737687
Product	transposase IS605
Protein accession	YP_343216
Protein GI	77164691
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAATAC AATGCGCCTA TAAGTTCAGG TTTTACCCAA CGCCCACGCA AAAGCGGCAA 
TTGGCCCTTG AGTTTGGCCA TGCCCGTTAT GTGTGGAATT GGGCCTTGGA AACCCGAACG 
AAGGCGTATC AAGCGCAGGG GGAGTCGTCG AATACTATAA GTCTTAGTCG CCAATTGACG 
GCACTGAAAA AGACGCAATG CCCCTGGTTG AGCGAAGCCA CCGCTAGTTG CCATACCCAA 
AAGCTCAGGG ACCAAGATAC GGCCTTCAGG AACTTTTTCG CAGGTCGAGC GAAGTATCCC 
CGCTTTAAGA AGCGCCACCA CACGCAATCG GTACGCTATC AGTTGGACCA ACGCCATGTG 
GCGAAGAACT TCAACGCTGA AAGCAAGCTG TTGAAGCTGC CCAAGCTTGG CAGAGTTAAG 
TTGAGATGGT CCCGTGGTAT CGAGGGCATC CCCAAGATGG TCACGGTCAG CCAAGCCCCG 
GCGGGCCGTT ACTTCGTTAG CCTGACCTGC GAGGTGGAGA TTCTCCCCTT GCCTGTGCGA 
AGGAACGCTA TCGGCGTGGA TGTGGGGGTT AAGGATGTGG TCATTACTTC CGAAGGCTGG 
AAGTCGGGTG CGCCCAAATA CACCTATCAC TATGCCCGGC AATTGAAAAT GGCCCAGCGT 
CGTTTGAGCA AGAAGTGTAA GGGCTCTCAC CGGAGGCGCA GGCAACAAGT GCGCGTTGCC 
CGAATCCATG CCCGGATTAA GGACAGCCGC CGGGATTTTT TGCACCAAAT TTCCTCCACG 
CTCATCCACG AGAACCCAGT GATCTGCCTG GAGGATTTGA ATATCCAAGG GATGCTGCGA 
AACCGCCGCC TGAGCAAAGC CGTTGCCGAT TGCGGGCTGT ATGAGCTCAG ACGGCAAATG 
GAGTACAAGG CCGCCTGGTA TGGCCGTGAT GTGTTGATCG CGGACCGCTG GGCACCCACC 
AGTAAAACCT GA

Protein sequence

MIIQCAYKFR FYPTPTQKRQ LALEFGHARY VWNWALETRT KAYQAQGESS NTISLSRQLT 
ALKKTQCPWL SEATASCHTQ KLRDQDTAFR NFFAGRAKYP RFKKRHHTQS VRYQLDQRHV 
AKNFNAESKL LKLPKLGRVK LRWSRGIEGI PKMVTVSQAP AGRYFVSLTC EVEILPLPVR 
RNAIGVDVGV KDVVITSEGW KSGAPKYTYH YARQLKMAQR RLSKKCKGSH RRRRQQVRVA 
RIHARIKDSR RDFLHQISST LIHENPVICL EDLNIQGMLR NRRLSKAVAD CGLYELRRQM 
EYKAAWYGRD VLIADRWAPT SKT