Gene Noc_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2198
Symbol
ID	3705136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2541892
End bp	2542998
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	55%
IMG OID	637738674
Product	transposase IS605
Protein accession	YP_344188
Protein GI	77165663
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01765] transposase, putative, N-terminal domain [TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTGG TAGCTAACCT CAAACTGACG CCAACTCCAG CGCAAGAACG CGAGTTGCGT 
TTGACGCTGG CGCGCTGTAA TGAAGCGTGC AACTGGCTCT CTGAGCGCGC TTGGGAAACG 
AAGACATTCC GGCAATACGA TTTGCATAAG CTCTGCTATC AAGCCGTGCG CGCCAAATTT 
GCATTGTCCG CTCAGGTGGC GGTGCGCTGC ATTGCTAAAG TGGCGCACGC CTACAAGCTT 
GACCAGAAAA CCCAGCGCGC CTTTCGTAAG CATGCGGCGC ATCCCTATGA TGACCGTATC 
CTGCGCTTTG TCTGTGATGA GAAAGTCTCC CTGTGGCTTT TGTCGGGTCG AGAAAAGATT 
GGCTATGTTG GTAGCGATCA CCAGCGCCAA TTGCTTGAAC ACCGCAAGGG CGAAGTCGAT 
TTGATGTTCG TGCGCGGCCA ATGGTATTTG GCCGCTGTAT GTGACTTTGA CGACCCCAAA 
TTGCTGACCC CTGAAGGCAT GTTGGGTGTG GATTTCGGTA TTGTCAATAT CGCCACTGAC 
AGCCTGGGTG AGAGGTACTG CGGGGCTAAA GTCCAAGCCT ACCGTGAGCG TTACGCCAAA 
CGACGCGCCA CCTTGCAGCG CCTCGGCACA CGGGCCGCTA AACGCTGCCT TCGCCACATA 
AGCGGCAGGC AGAAACGGTT TCAAAAATAC GAGAACCATT GTATCTCCAA ACGCATCGTC 
TCGACTGCGG AACGCTCCCG TCTCGGCATT GGACTTGAAA ATCTCAAGCA TATCCGGGCA 
CGGGTTAAGG CCAACAAAGC GCAGAGGAAA CGCTTGCATA ACTGGGGCTT CGCTCAGCTT 
CGTGCCTTTA TCGAGTATAA GGCTAAACGT GCTGGCGTGC CGGTGGTGAT AGTCGACCCA 
CGCAACACTA GCCGCGAGTG CCCGGCCTGT GGCCGTATCG ACAAAGCTAA CCGGCCAACC 
CAGTCTGAGT TTCGGTGTGT GGAATGCGGG CACAGTAATC ACGCAGACCA TAACGCCGCT 
GGCAATATCG CCAGAAGGGC TGCTGTAACT CAGCCTATGT TCGCGCATAA GTGTGCTCCT 
TGTGCAGTGG AAAGCCGCCA GCTTTAG

Protein sequence

MKLVANLKLT PTPAQERELR LTLARCNEAC NWLSERAWET KTFRQYDLHK LCYQAVRAKF 
ALSAQVAVRC IAKVAHAYKL DQKTQRAFRK HAAHPYDDRI LRFVCDEKVS LWLLSGREKI 
GYVGSDHQRQ LLEHRKGEVD LMFVRGQWYL AAVCDFDDPK LLTPEGMLGV DFGIVNIATD 
SLGERYCGAK VQAYRERYAK RRATLQRLGT RAAKRCLRHI SGRQKRFQKY ENHCISKRIV 
STAERSRLGI GLENLKHIRA RVKANKAQRK RLHNWGFAQL RAFIEYKAKR AGVPVVIVDP 
RNTSRECPAC GRIDKANRPT QSEFRCVECG HSNHADHNAA GNIARRAAVT QPMFAHKCAP 
CAVESRQL