Gene Nwi_1936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1936
Symbol
ID	3676792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	2124041
End bp	2125075
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	68%
IMG OID	637713501
Product	hypothetical protein
Protein accession	YP_318548
Protein GI	75676127
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03640] CRISPR-associated endonuclease Cas1, DVULG subtype

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAAGC TCCTCAACAC GGTCTATGTC ACGACTGAGG GAGTGGCGCT GCGCAAGGAC 
GGAGAGAACC TCGTGGCGGA GGTGGAAGGC GAGGAGCGGG CCCGCGTGCC GCTCCACATG 
CTTGCCTCGT TGGTTGTTTT CGGACCGATC CACATTTCGC CTGCATTGAT GGCGGCCTGC 
GCCGGCGCCG GCATCGCGAT CGCGCTGCTC GACCGCAACG GCCGCTTTCG GGCCCGCGTC 
GAAGGACCGG TGACTGGCAA TGTGTTGTTG AGGCGGGCAC AATACCGGGT CTCGGAGGCT 
CCGGAGCCCG TCGTGCGGTC GATCCTCGTC GGCAAGGTGG CCAACCAGCG CTCCGTCTTG 
ATGCGCGCCT TGCGTGATCA CCGCGAGGAG CTCGAGCCCG GCGATCGCGA CGCGATAACC 
GCCGTGACGG AGCGCCTTGC CTTCATCCTG CGCCGGGTGG AGCGCTCCGA TGGCGGTCTC 
GATGTGCTAC GCGGCGCGGA GGGAGAGGCG GCGAACCTCT ATTTCTCGGT CTTCGACAAT 
CTCCTGCGCG TGCCCGACCC GGACTTGCGC TGGAAGGGGC GCTCGCGTCG GCCGCCGCTC 
GATCCCATCA ACGCGCTGCT CTCCTTTCTC TACACGCTGC TCACCCATGA CTGCCGCAGC 
GCCTGCGAAA GCGTTGGCCT TGATCCCGCC GTCGGCTTCC TGCACCGCGA CCGGCCGGGG 
CGGCCGAGCC TCGCGCTGGA TCTGATGGAG GAGTTGCGTC CCGTGCTCAC CGACCGGCTG 
GCCCTGTCAC TGATCAACCG CCGCCAGCTC CGAGCAGGCG ACTTCGAGAA GCGCGACGGC 
GGCGCCGTGG TCATGAGCGA CGACGCGCGC CGCACCGTCC TCACCGCCTG GCAGGAACGC 
AAGAAGGAGG AGCGGCTTCA CCCCTTCCTG CAAGAGAAGG CGCCGCTTGG CCTCGTCCCC 
TACCTGCAGG CGCAGATGCT GGCGCGGCAT TTGCGGGGCG ACCTCGACGC CTATCCGCCC 
TGGTTCTGGA AGTAG

Protein sequence

MKKLLNTVYV TTEGVALRKD GENLVAEVEG EERARVPLHM LASLVVFGPI HISPALMAAC 
AGAGIAIALL DRNGRFRARV EGPVTGNVLL RRAQYRVSEA PEPVVRSILV GKVANQRSVL 
MRALRDHREE LEPGDRDAIT AVTERLAFIL RRVERSDGGL DVLRGAEGEA ANLYFSVFDN 
LLRVPDPDLR WKGRSRRPPL DPINALLSFL YTLLTHDCRS ACESVGLDPA VGFLHRDRPG 
RPSLALDLME ELRPVLTDRL ALSLINRRQL RAGDFEKRDG GAVVMSDDAR RTVLTAWQER 
KKEERLHPFL QEKAPLGLVP YLQAQMLARH LRGDLDAYPP WFWK