Gene Noc_A0028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_A0028
Symbol
ID	3704331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007483
Strand	+
Start bp	24008
End bp	26758
Gene Length	2751 bp
Protein Length	916 aa
Translation table	11
GC content	54%
IMG OID	637736523
Product	hypothetical protein
Protein accession	YP_342071
Protein GI	77163545
COG category	[V] Defense mechanisms
COG ID	[COG1002] Type II restriction enzyme, methylase subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTCG ATCAAACCTA CTGCATGGAT ACCCTCATTG CTGCGACCCG GCCTGATGCT 
GATCTCGGAG AGTTCATTTT TGCCTTTCTC GACGCCTATA ACTTTCCCAA GGCGACGGTT 
ACGCAGATTC GCAAGGGTGG TCAACGTAAC GTCGCCAGCC GTAAAAATGA AGGGCACGTC 
GCGATGAAGA ACTGGCTGTA CTTCATGCCG GTGCGAGCGG GCGAGAGCAT TCACGAGGCG 
CTCCAGGTAC TGGCAGATGA AGAAGAGCCG CCGCGCCATA AGTGTCGCTT TCTGGTGGTG 
ACCGACTATC AAGAACTCAC TGCACTGGAT ACCAGGACGG ATGAGCGTTT GGAGGTGATT 
CTCGGTGAGC TGGCCACCCA ATACCTGTTC TTTGCCCCCA TGGCGGGGCT TGAGCGTACC 
AAGCCATTTA GCGAAGAATC GGCCGACCTC AAGGCCGCCG CCAAGATGGG GCGGCTGTTT 
GATCGCCTGA AGGAAATCAA CGAGTTTCAG ACTCCCGAGC AGCTTCACGC GCTTAACGTG 
TTTCTGACCC GGTTGCTGTT CTGCTATTTC GCTGAGGATA CCGGGATTTT CCCCAAGAAC 
GCCTTCACCA AAGTGATCAC CGAAGCTAGC GGCAAGAACG GCGAGGGGCT ATCCGACCTA 
CTAAAGCAGC TGTTCCGAGT GATGGATCAA GCCGAGGGCG AGCGACCGGC GGACTTGCCA 
GCTCATATTG CCCAGTTCCC TTATGTCAAC GGCGGCCTAT TCCGTGACAA CATGCCAGCC 
CCCAAGATGC GCGGTAAAGC CAGACGGATG ATGATCGAGT GCGGCAAACT CCAGTGGAAG 
GCCGTCAACC CCGATATCTT CGGCTCGATG TTTCAGGCGG TAGTAGACGA AAAGAGCCGT 
GACTCGTTGG GCCAGCACTA CACCTCTGTA CCGAACATCA TGAAGGTGAT CCGTCCCCTG 
TTCCTCGACA AGCTGTATGC CGACCTGCAC AAGTCAAAGG GCAAACGCAG GCAACTGGAA 
GCACTACTGG TACGGCTGGC CCGTATTTGG GTGTTCGATC CGGCGATGGG CTCCGGCAAT 
TTTCTGATCA TCGCCTATAA GGAACTGCGC CGACTGGAGA TGGCCACCTT CCGGTCACTT 
CAAGCTATGA GTGGTAGTGG CCAGCAGGAA ATTTTCATGA GTGGCATCCA GCTCAGCCAG 
TTCTATGGTA TCGAGATCGA CGATTTCGCG CACGAAATTG CCCAGCTATC CCTATGGCTG 
GTTGAGCATC AGATGAACAC GCTGTTTGTA AAGGAGTTTG GTCATGCTGA GCCAGTGCTA 
CCGCTAAAAG ATACTGCCAA CTTGGTGCAA GGAAATAGCC TTCGGATGGA TTGGCAGAAG 
GTATGTCCCA ATGATGGCAG CGCTGAAATA TATGTATGCG GGAACCCGCC ATTTATTGGC 
CATGGTAGTC GAGAGAATAG CCAGCTCGAC GATATGCGAT TGGTGTTAGG GCAGCTGATT 
CGCACATACA AGTCCCTCGA CTATGTGGCC TGCTGGTTCT TTTTGGCTGC GGAATACTGT 
CGCCACGGGA CAGCAAACGC CGCCTTTGTG TCGACGAACT CTCTATGCCA AGGCAAACAA 
GCGGGGCTAC TGTGGCCGTT GTTGGTAGAT ATGGGGATGA AAATCAGCTT TAGCTACCAA 
ACTTTCCCTT GGCGGAACAG TGCAAAGGGT AACGCAGGTG TGCATGTTGT GGTCATTGGG 
CTGGCTGCTC ATAACGGACC ACGGGTACTC TTCAACCGTA TTGATGGTGC CTGGCATCGT 
AAAGAAGTTA CGAACATCAG CCCCTATCTA CTAGAAGGAG GCGACACTGT TGTACGGGAG 
CGACGAGATC CGCTAATTCA GGACGCATTA CCAATGTACT TTGGCAATAT GCCTAACGAC 
GGTGGCCACC TCCTGTTGAC CGCAGGGGAT AAAGAGAAGT TAATCGCACA AGAGCCCGCG 
GCAGAGGCTT GGATCAAGCG CTTAATGGGG GCTAAAGAGT TCCTGCAAGG CCATGAGCGC 
TGGTGTCTGT GGTTGGTTAA TGCCACGAAA GAAGAAATCG ATGCTATGCC TGTGGTTCGC 
GAGCGAGTGG AGCGTGTGCG GGAAACACGT CTTGCTAGCA AAGATGCTGG CGCACGAAAG 
CTCGCCGAAC GGCCGCACCA ATTCCGAGAC CTTAATAACC CGGAAAGCTT CATTTTAGTC 
CCAAGCGTTA CATCCGAGCG CCGGAAATAT GCGCCCGTCG GGATTTTTGA AGAAGACGTA 
ATTGCTACTA ACCTAACATT AATCATTCCA GATGCTGGGT TATACGATTT CGCCATTCTT 
TCCACGCAAA TGCACATGGA CTGGCTACGC CTGGTGGGAG GCCGTTTAGA AAGCCGTTAC 
CGCTATTCTG CAACTATCGT CTACAACACC TTCCCTTGGC CCAATGCTAC CGAAGCACAG 
CGTAACGCTA TCGAAAAACT AGGCCGAGCC GTTATTCTGG CGCGTGCAGC GCATCCCGAT 
AAAACCATGG CCCAGCTTTA TGACCCGGAC AAGATGCCGG ACAAACTGCT GGAGGCCCAC 
CAAGCACTGG ACCGCGCCGT GGAGCGCCTG TATCGGGAGC GCCCCTTCCG CGATACCGCT 
GAGCGTCAGG AATATCTGCT GGCCCGCTAT GAGTCGCTGA TTGAGGCGGA GAAAACCGCC 
AAGGCTGGTA GCAGGAAACA GCCTCGAAAA GCCACGAGTA TGGAGAGTTA A

Protein sequence

MAFDQTYCMD TLIAATRPDA DLGEFIFAFL DAYNFPKATV TQIRKGGQRN VASRKNEGHV 
AMKNWLYFMP VRAGESIHEA LQVLADEEEP PRHKCRFLVV TDYQELTALD TRTDERLEVI 
LGELATQYLF FAPMAGLERT KPFSEESADL KAAAKMGRLF DRLKEINEFQ TPEQLHALNV 
FLTRLLFCYF AEDTGIFPKN AFTKVITEAS GKNGEGLSDL LKQLFRVMDQ AEGERPADLP 
AHIAQFPYVN GGLFRDNMPA PKMRGKARRM MIECGKLQWK AVNPDIFGSM FQAVVDEKSR 
DSLGQHYTSV PNIMKVIRPL FLDKLYADLH KSKGKRRQLE ALLVRLARIW VFDPAMGSGN 
FLIIAYKELR RLEMATFRSL QAMSGSGQQE IFMSGIQLSQ FYGIEIDDFA HEIAQLSLWL 
VEHQMNTLFV KEFGHAEPVL PLKDTANLVQ GNSLRMDWQK VCPNDGSAEI YVCGNPPFIG 
HGSRENSQLD DMRLVLGQLI RTYKSLDYVA CWFFLAAEYC RHGTANAAFV STNSLCQGKQ 
AGLLWPLLVD MGMKISFSYQ TFPWRNSAKG NAGVHVVVIG LAAHNGPRVL FNRIDGAWHR 
KEVTNISPYL LEGGDTVVRE RRDPLIQDAL PMYFGNMPND GGHLLLTAGD KEKLIAQEPA 
AEAWIKRLMG AKEFLQGHER WCLWLVNATK EEIDAMPVVR ERVERVRETR LASKDAGARK 
LAERPHQFRD LNNPESFILV PSVTSERRKY APVGIFEEDV IATNLTLIIP DAGLYDFAIL 
STQMHMDWLR LVGGRLESRY RYSATIVYNT FPWPNATEAQ RNAIEKLGRA VILARAAHPD 
KTMAQLYDPD KMPDKLLEAH QALDRAVERL YRERPFRDTA ERQEYLLARY ESLIEAEKTA 
KAGSRKQPRK ATSMES