Gene Nwi_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_0039
Symbol
ID	3675162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	43206
End bp	44549
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	67%
IMG OID	637711574
Product	hypothetical protein
Protein accession	YP_316659
Protein GI	75674238
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.304092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.27217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGCGA CGATCGCCGC GGTGTTGATG ATCGTGGCCA CCACGATGTA CGCTCAGGCG 
CAACCCGGCA ACCCCGTCGG ACGGACAAAA GGTAAACCGG AAGCCGCCGT CTCCCCGCCG 
GCGCAAACTC CGGCCGATAC CGTGAGGGCG ATGGCGTCCG CGGCGCGGCA AGCGTTGCAA 
TCCGACCTGG CATGGACCGG TCACTATAAC GGCCTCATCA ACGGCGAGGT CAGCGACCGG 
ATGATTGCCG CGATCAAGGC ATTCCAGAAG GAGCGGGCCG GCAAGCAGAC CGGCGTGCTC 
AACCCGCAGG AACGCGGCGT TCTCGCCGCT GCCGCGCGGA AGGCGCGGGC GAATGTCGGA 
TGGAAAATCG CGGCAGACGC TGCGACCGGC GTCCGGCTGG GCCTGCCCAT GAGGCTGACG 
CCTCAGCAAT CGAGCGCAGG CGACGGCACG ACTTGGAGTT CCTCAACCGG CACCATCCAG 
ATCAGCGTGA CGCGCCGCAA GGAGTCCGGC CTCACAACCG CCAGGCTTGC CGATCACGCA 
CGCAAACAAT CGCCCGGCCG CAAGGTCACC TACAGCGCCG TCAAGCCGGA CGTCTTCGTG 
CTGTCGGGCA CACAGGGCCT GAAGAAATTC TACATGCGCG GCCAGCTTCG CGACAGCGAA 
GCCCGCATCC TGACCATTCT CTACGATCAG GCGACCGAAG GCGTCATGGA GCCGGTGGTG 
ATCGCGATGT CGAGCGCGTT CGATCCGTTT CCGGCGAACG GTCCGCCGCC GCGCAAGCTC 
GTGGAATATG CAAGCGGGGT GATCGTCAGC GACGGCGGCG CGATCCTGAC CGGTCACGAG 
GCCACCGACG GATGCCGGTC GATCGTCGTC ACGGGCCACG GCTACGCCGA CAGGATCGCC 
GGCGACAAGG ACCACGGCCT CGCGCTGCTG CGAGTCTATG GCGCGCACGG GTTGCAGCCG 
ATCCCGCTCG GCCGCGCTGC GGCCAAAGGC GGCGTCGATC TTGTCGGCAT CACCGATCCG 
CAAAACCAGG GCGGCGGCTC CGCCATCAGT CGCGTCAAGG CGTCGGTGTC GGGAGGCGAC 
GGCGGTGAAT TGATGCTGAC GCCCGCGCCC GCGTCAGGCT TTTCCGGCGC GGCGGCGCTC 
GATGCAAACG GAAAGCTCGC AGGGCTGGCG CTGGTGAAGC CCGCGGACAT CGCCGGGCTT 
TCGGGCGCGA CGCCTCCCGC GCAGGCCGTG CTCGCTCCAG CGCAAGCCCT GCGCGCTTTT 
CTGAAAGCCA ACGACTTGGA CCCGTTCGAC GGATCGTTCG ATGCGGAGGC CGCCGTGGTT 
CGCGTCATCT GCGTGCGGAG ATAA

Protein sequence

MRATIAAVLM IVATTMYAQA QPGNPVGRTK GKPEAAVSPP AQTPADTVRA MASAARQALQ 
SDLAWTGHYN GLINGEVSDR MIAAIKAFQK ERAGKQTGVL NPQERGVLAA AARKARANVG 
WKIAADAATG VRLGLPMRLT PQQSSAGDGT TWSSSTGTIQ ISVTRRKESG LTTARLADHA 
RKQSPGRKVT YSAVKPDVFV LSGTQGLKKF YMRGQLRDSE ARILTILYDQ ATEGVMEPVV 
IAMSSAFDPF PANGPPPRKL VEYASGVIVS DGGAILTGHE ATDGCRSIVV TGHGYADRIA 
GDKDHGLALL RVYGAHGLQP IPLGRAAAKG GVDLVGITDP QNQGGGSAIS RVKASVSGGD 
GGELMLTPAP ASGFSGAAAL DANGKLAGLA LVKPADIAGL SGATPPAQAV LAPAQALRAF 
LKANDLDPFD GSFDAEAAVV RVICVRR