Gene Nwi_1253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1253
Symbol
ID	3676578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	1381386
End bp	1383179
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	61%
IMG OID	637712803
Product	Type I restriction enzyme EcoAI specificity protein
Protein accession	YP_317866
Protein GI	75675445
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00376854
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATG GCCCGATGAA CGCGGAACGC CTGCTTAGTG CTTACGAGAA AATTGCCGAC 
GCGCCCGACG CGATCGCCCG CCTGCGCCGC TTCGTGCTCG ATCTGGCCGT GCGCGGCAAG 
CTGGTGCCGC AGGATGCGAA CGACGAACCG GCATCGGAAT TGCTGAAGCG GATCGCGAAG 
GAAAAGGCGC GGCTGGTGAA GGCGGGCGAG ATCAGGAAGC CGAAAGCGAT CCCCGCTCTT 
CCTGAACCAC CGTTCCCAAT TCCGTCGAAT TGGCGTTGGT CGCAGCTTGC CGAGATCGGC 
GTGTTAAGCC CGCGCAACGA AGCGCCCGAC ACACTCGAAG CGTCCTTCGT GCCAATGCCG 
CTCATTGCCG CCGAATATGG CGTCGCTAAC CAGCATGAAA TCCGGCCTTG GGGCGAGATC 
AAGAAGGGCT ACACGCATTT TGCCGAGGGC GATGTTGGCC TCGCCAAGAT CACGCCGTGC 
TTCGAGAACG GCAAATCGAC CGTGTTCCGA AACCTGACTG GCGGGATCGG CACCGGCACG 
ACCGAGTTGC ATATCGTCCG CCCGTTGTTC GTCGATCAGG ATTACATCCT GCTGTTTCTC 
AAGAGCCCGC ATTTCATCGA AACCGGCATC CCGAGAATGA CCGGTACGGC CGGCCAGAAG 
CGCGTGCCGA CCGAATATTT CGCGCATTCG CCCTTTCCCC TCCCGCCGCT CGCCGAACAG 
CACCGCATCG TCGCCAAGGT CGATGCGTTG ATGGGCCTGT GCGACCGGCT GAAAACAGCG 
AGGGAACAGC GGGAAACGGT GCGCGACCGG CTGGCGGCGG CGAGCCTCGC CCGTCTCAAC 
GCGCCCGATC CCGAACCCGG AGCGGACCCA GCAAAAGTGG GAACCGGTTT TGCGTCCGGG 
TCCGCGACCA ACGAAAAGTT CCAGGCCGAC GCCCGCTTCG CCCTCGACGC GCTGCCGGCG 
CTAACCACGC GCCCCGACCA GATCAAGGCG CTGCGCCAGA CCATCCTCAA CCTCGCCGTG 
CGCGGCAAGC TGGTGCCGCA AGACCCGAAC GACGAACCGG CTTCGGAACT GCTCAAGCGG 
ATTGCGAGAG CAAAAGCCGA GCGCAAGAAG AAAACCGGCG ATGCAAGGAT CAAGATTGAA 
CCCGATCCGA CGCCCGATGA ACTCAACATG CCGATTCCGG TGGAATGGGC CGTCCAATCG 
TTCGAGAACC TATTTCTTTT TATCGACTAT CGCGGAAACA CGCCGCCCAA GACGGATGAA 
GGCATCCCTC TCATCACCGC AAAAAACATT CGCATGGGAT ACCTGAATCG CGAGCCGCGC 
GAGTTCATCT CAAAAGCGAC CTTTAAGACC TGGATGACGC GTGGCTTTCC CGAGATCGGC 
GACTTGTTTT TCACGACCGA AGCGCCACTC GCCAACGTGT GCCTTAACGA TATCGAGGAA 
CCTTTCGCTC TCGCGCAACG CGCGATCTGT TTTCAGCCAT ATGCGAAGAT CGACACCAAG 
TTCCTGATGT TCGCGTTGAT GAGCGACGTA ATGCAATCGC TGATCGACAA GCACGCAACC 
GGCATGACAG CCAAGGGCAT CAAGGCGGCC AAATTGAAGC CGCTTCCAAT CCCGATCCCA 
CCCCTTGCCG AACAACACCG CATCGTCGCT AAGGTCGATG AGTTGATGGC GCTCTGCGAC 
CGGCTGGAGG CGAGCCTCAC CGCCACTGCC GCCACAAGCC GCCGCCTGCT CGACGCCCTC 
CTGGCTGAAG CGCTGGCGCC GGCCGAGGAT CGCGAAATGG AGGCGGCGGA ATAA

Protein sequence

MNDGPMNAER LLSAYEKIAD APDAIARLRR FVLDLAVRGK LVPQDANDEP ASELLKRIAK 
EKARLVKAGE IRKPKAIPAL PEPPFPIPSN WRWSQLAEIG VLSPRNEAPD TLEASFVPMP 
LIAAEYGVAN QHEIRPWGEI KKGYTHFAEG DVGLAKITPC FENGKSTVFR NLTGGIGTGT 
TELHIVRPLF VDQDYILLFL KSPHFIETGI PRMTGTAGQK RVPTEYFAHS PFPLPPLAEQ 
HRIVAKVDAL MGLCDRLKTA REQRETVRDR LAAASLARLN APDPEPGADP AKVGTGFASG 
SATNEKFQAD ARFALDALPA LTTRPDQIKA LRQTILNLAV RGKLVPQDPN DEPASELLKR 
IARAKAERKK KTGDARIKIE PDPTPDELNM PIPVEWAVQS FENLFLFIDY RGNTPPKTDE 
GIPLITAKNI RMGYLNREPR EFISKATFKT WMTRGFPEIG DLFFTTEAPL ANVCLNDIEE 
PFALAQRAIC FQPYAKIDTK FLMFALMSDV MQSLIDKHAT GMTAKGIKAA KLKPLPIPIP 
PLAEQHRIVA KVDELMALCD RLEASLTATA ATSRRLLDAL LAEALAPAED REMEAAE