Gene Nwi_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_3020
Symbol
ID	3676390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	3267173
End bp	3268219
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	69%
IMG OID	637714587
Product	hypothetical protein
Protein accession	YP_319622
Protein GI	75677201
COG category	[S] Function unknown
COG ID	[COG3768] Predicted membrane protein
TIGRFAM ID	[TIGR01620] conserved hypothetical protein, TIGR01620

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAGC GTACCGGCCA GCGCCGTCCC GTCACCTTCA AGCTCGACGA TCCGCACGTC 
GTGGTCCTGG AACGCGACGA GGCCGCTGCC CGGCCCGCTC GCGGCAGCAT CAGCATCACG 
CCGGAAGCGG AACCCGAGCC GGAGCCGGTG CTGCTGCCGG AATCGCCGGA TACGCCTCCG 
GTGCCGGCGC GGAAGGGATT TCGCTGGGGG GTGCTGTTCT GGTCGTCGCT GGCCGGGCTC 
ATCCTGCTCG GCACCGTCCT CGGCGCGATC AACTTGATCG GGGACCTGTT CGCGCGCAGC 
GAAGGACTTG GTTTTCTCGG GCTGACGCTG GCGGCGCTGT TCGTCGTGGC ATCGATCGTC 
ATCGCGGCAC GCGAGATTCT TGGCCTTGCC CGTCTCGCCA CCATCGAGAA CCTGCACCGG 
CGCGCGCTGG CCGCGATCGC GGCTGACGAT CGCAAGGAGG CGGATGCGGT GGTGCGCGAT 
CTGGTGAAGC TCGCCCACAA CGATCCGCAT CTGGCGCGGG CGCGGGCCAC GTTGCGGAGC 
CACAGCACCG ACATCATCGA CGGCGCCGAT CTGGTGCGGC TGGCGGAGCG CGAACTGATG 
GCTCCGCTGG ATCAGGAGGC CCGCCGGCTG GTGTCGGTGG CGGCGCAGCG CGTGTCGATC 
GTCACCGCGA TCAGCCCCCG CGCCGTCGTG GACGTGCTGT TCGTATTCGC CGCCGCGATG 
CGGCTGGTGC GGCAGCTCGC GCGCCTCTAT GGCGGAAGGC CGGGCACGCT CGGGATGATC 
CGGCTGATGC GCCACGTCAT CGCGCATCTC GCGATCACCG GCGGCATCGC GGCCAGTGAC 
ACGCTGATCC AGCAGATGGT CGGTCAGGGC ATCGCCGCGA AACTGTCGAC GCGTCTGGGC 
GAAGGCGTGC TCAACGGATT GCTGACCGCC CGTCTCGGGC TTGCGGCGAT CGACGTCACC 
CGGCCGATGC CGTTCACGGC GCTGCCACGT CCCGCGCTCG GCGATCTGGT CAAAGATCTG 
TTGCGCAAGC GCGACGGCGG CAATTGA

Protein sequence

MSERTGQRRP VTFKLDDPHV VVLERDEAAA RPARGSISIT PEAEPEPEPV LLPESPDTPP 
VPARKGFRWG VLFWSSLAGL ILLGTVLGAI NLIGDLFARS EGLGFLGLTL AALFVVASIV 
IAAREILGLA RLATIENLHR RALAAIAADD RKEADAVVRD LVKLAHNDPH LARARATLRS 
HSTDIIDGAD LVRLAERELM APLDQEARRL VSVAAQRVSI VTAISPRAVV DVLFVFAAAM 
RLVRQLARLY GGRPGTLGMI RLMRHVIAHL AITGGIAASD TLIQQMVGQG IAAKLSTRLG 
EGVLNGLLTA RLGLAAIDVT RPMPFTALPR PALGDLVKDL LRKRDGGN