Gene Nwi_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1941
Symbol
ID	3674785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	2129211
End bp	2131445
Gene Length	2235 bp
Protein Length	744 aa
Translation table	11
GC content	62%
IMG OID	637713506
Product	CRISPR-associated helicase Cas3 family protein protein
Protein accession	YP_318553
Protein GI	75676132
COG category	[R] General function prediction only
COG ID	[COG1203] Predicted helicases
TIGRFAM ID	[TIGR01587] CRISPR-associated helicase Cas3 [TIGR01596] CRISPR-associated endonuclease Cas3-HD

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.557598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTATC ACGCTCATTC GGGCAAGCTG ACGGATGAGA GCGACTGGCA GATCCTGTCG 
CATCACTTAA CACGGGTTGC GGCTCGCGCT GGTATTTACG GCTCCCCCAT AGGCTTGGAA 
GGGCTGGCGA AGATCGCCGG CCTTTTTCAC GACTTGGGTA AGTACACAGC GGACTTCCAA 
AGACGGCTGC ACGGCATAAA TTTGCGGGTC GATCATTCGA CGGCAGGCGC CGCCGTGCTG 
ATGAAGATGG TGCCGAGGCC GGTTCGGGAA ATCGCGGAAC TTGTTGCCTA CACGATACTG 
GGACATCACG CCGGCCTGCC CGACAAGTTC AACGAGTTCG GCCATTGCTT CCTGCGTCGG 
GTTAGGGAGT TCGAGGACCG CCTCGACCCG GTGTGGAAGG ACCAGCTGTC GTTCGATCTC 
GGCGACCTGC AGATGCGCGA GTTGATGGGC AAGTTGTCGC CGGAGAAGAG GATCGCCGAG 
TTTGAGCTTT CGGTCGTGAC GCGCATGCTC TTCTCCTGCC TGGTGGATGC CGATTTCAAG 
GACACGGAAG CGTTCTACGA CGCGCTCGAA GGTCGGCAGT CGAACCGGGA ATGGCCGCTA 
CTGCAGGACG TCCTGCCGGC CTTCCTCGCC GCATTCGATG CTCACATGGC GGCGAAGTCG 
AAGGATGGCG AGGTCAACCG GTTGCGAGGC GACATCCTGG CGCATGTGCG GGCGGGAGCA 
TTGAACGAGC CGGGACTGTT CACGCTCAAC GTTCCGACCG GCGGTGGCAA GACGCTGGCC 
TCGCTCGGCT TTGCTTTGGC TCACGCTAGG AAGTGGGATC ACCGCCGCAT CATCTATGCG 
ATTCCGTTTA CTTCGATCGT CGACCAGACG GCCGCAATAT TCCGGGACAT TCTCGGCGAG 
GATAACGTGC TCGAGCACCA TTCCGCGATC GACGAAGAAC ACATCGAGGA GCGGTGGGGC 
CGTGACAAGC TGAAGCTCGC CATGCAGGAC TGGGCCGCGC CAGTGGTCGT GACCACCAAT 
GTCCAGTTCT TCGAAAGCCT GTTCGCTGCG AGAACTTCGC GGGCGCGCAA GCTGCACAAC 
ATCGCCGGCT CGATCATCAT CCTGGACGAG GCGCAGACCA TCCCGCGGCC GCTGCTGAAG 
CCGTGCGTAC GGATGCTCGA TGCGCTGGCG AGGCTGTTCG GCTGCACCAT CGTGCTGTGC 
ACGGCCACGC AGCCGGCCCT CGACGCCTCG AACTTCCCCG ATGGGCTGAA ACTTGACGGC 
CGCGAGCTGG CGCCCGATCC TGGGAAGCTT TCAGCCAGGC TGAAGCGAGC GCGGATCGTG 
CGCGTCGGAG CGATGAACAA TCCGGAGCTA ATTGAGGCGA TCCGCGCCGA GCCGCAGGCG 
CTGTTCATCG TCAATAGCCG CAAGCATGCG CTGGACCTCT ACAAGGAAGG GAAGAACGCC 
GGAGTTGACG GACTTGTCCA TCTCACCACC CGCCAGTGCG CCGCTCACCG GCGTCTGATC 
CTCGGCGACG TCAAGGCGCG GCTGAAGAAC GGGGAGACGT GCCGGCTGGT CGCGACCAGC 
CTCATCGAAG CTGGCGTCGA CGTGGATTTT CCAGGAGTCT GGCGGGCCGA GGCAGGGCTC 
GATCAGATCG TCCAGGCGGC CGGCCGATGC AACCGTGAGG GCAGGCATCC GGTGGAGGAC 
AGCATCGTCA GCGTCTTCTC GGCGCCCGAC TACCCGCCAC CGCGCGAGAT TGCCGGCCTG 
ATCGGCGACA TGGGCCGGGT GATCCCCAAG CATGAGGACC TGCTGTCGCT CGGGGCGATC 
GCCGATTATT TCGGCGAGGT CTATTGGCGG GCAGGCCCCG AACTGGATGC GAAGAAGATA 
TTGGAGGGCT TCAAGATCAA CCGCGACGGC ACCGATTTCG CTTTCCGCTG CGTGGCGGAA 
AAGTTCCGGA TGATCGAGAG CGGCATGGAG CCGGTCATCG TGGAGTTCGA TAACGACGCC 
GAGGAAACCG TAACGGAGCT GGAATTCGAG CGGATATCTT CTGGCGTGCT TGCGCGAAAG 
CTGCAATCAT ACATTGTGCA GGTGCCGCCC AAGGCACGTC GATTGCTGAT CGACAATGGC 
CACGTGGCTT TCGTACGGCC GGATATAAGG GGGGATCAGT TCGCGGTGCT CAAGAACGCA 
TCACTCTATC GCCAGGAGGT TGGCCTGATG TGGGAGGACG CGGCGTACCT TGCGGCCGAG 
AGTTGGCAGA TTTGA

Protein sequence

MTYHAHSGKL TDESDWQILS HHLTRVAARA GIYGSPIGLE GLAKIAGLFH DLGKYTADFQ 
RRLHGINLRV DHSTAGAAVL MKMVPRPVRE IAELVAYTIL GHHAGLPDKF NEFGHCFLRR 
VREFEDRLDP VWKDQLSFDL GDLQMRELMG KLSPEKRIAE FELSVVTRML FSCLVDADFK 
DTEAFYDALE GRQSNREWPL LQDVLPAFLA AFDAHMAAKS KDGEVNRLRG DILAHVRAGA 
LNEPGLFTLN VPTGGGKTLA SLGFALAHAR KWDHRRIIYA IPFTSIVDQT AAIFRDILGE 
DNVLEHHSAI DEEHIEERWG RDKLKLAMQD WAAPVVVTTN VQFFESLFAA RTSRARKLHN 
IAGSIIILDE AQTIPRPLLK PCVRMLDALA RLFGCTIVLC TATQPALDAS NFPDGLKLDG 
RELAPDPGKL SARLKRARIV RVGAMNNPEL IEAIRAEPQA LFIVNSRKHA LDLYKEGKNA 
GVDGLVHLTT RQCAAHRRLI LGDVKARLKN GETCRLVATS LIEAGVDVDF PGVWRAEAGL 
DQIVQAAGRC NREGRHPVED SIVSVFSAPD YPPPREIAGL IGDMGRVIPK HEDLLSLGAI 
ADYFGEVYWR AGPELDAKKI LEGFKINRDG TDFAFRCVAE KFRMIESGME PVIVEFDNDA 
EETVTELEFE RISSGVLARK LQSYIVQVPP KARRLLIDNG HVAFVRPDIR GDQFAVLKNA 
SLYRQEVGLM WEDAAYLAAE SWQI