Gene Nwi_1529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1529
Symbol
ID	3676554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	1668890
End bp	1669930
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	58%
IMG OID	637713083
Product	extracellular solute-binding protein
Protein accession	YP_318142
Protein GI	75675721
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.202985
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGCG TATTTACTGC TATTTTCGCT ATCGTTGCTG GTATTTCATT ACAACCGGCA 
TCCGCGCAGG AGCAGGAATC CGCGAAGGCG AAGACCACGC TCGAAGCAGT CAAGGCGCGA 
GGCGCGCTGT CGTGCGGCGT CAGTCAGGGG TTGCCGGGCT TCTCCGCCCC TGACGACAAA 
GGAAACTGGA CGGGCCTCGA CGTGGACATC TGCCGCGCGA TCGCGGCCGT GGTGTTCAAC 
GATCCCACCA AGGTCAAGTT TGTTCCGCTG TCCGCGAAAG ACCGGTTTAT CGCCCTGCAA 
TCCGGCGAAA TCGATGTGCT GTCGCGCGAC ACCACATGGA CGCTCTCGCG CGACACGTCG 
CTCGGAGCCA ATTTCACCGG CGTGACATAC TACGACGGAC AAGGCTTCCT GATCAGGAAG 
TCCCTCAAGG TGAACTCGGC GCTGGAATTG AACAGCGCAT CGGTCTGCGT TCAGACCGGC 
ACCACGAACG AACAGAATCT CGCCGATTAT TTCAAAAGCA ACAAGATGAA GTACGAGGTC 
ATTGCATTCA GCACCGCCGA CGAGACCATA AAGGCCTACG AATCCGGCCG GTGCGATGTG 
TTCACTTCGG ATATTTCACA GCTCTACGCC CAGCGGCTGA AGCTCATTAA TCCCGCCGAT 
CATGCGGTTC TGCCGGAGGT CATCTCGAAG GAGCCGCACG CGACGATGGT GCGTCACGGC 
GATGACCAGT GGTTCGATCT CGTGAAGTGG ACGCTGTTTG CGATGATCAA TGCCGAAGAA 
CTCGGCATCA CGAAGAAGAA CGTTGACGAA ATGGCCAGAT CCGAGAATCC CGAACTCAAG 
CGCATATTCG GAACAGACGG CAATTTCGGC GAGCAGCTCG GCGTCACCAA GGATTGGGTT 
TCGCGAATCA TCAAGGCCGT CGGCAACTAT GGCGAATCGT TCGATCGCAA CGTCGGCGCC 
GGCTCGCCGC TCGGGATCGC GCGAGGACTC AACAAGCTCT GGAATCAGGG CGGAATCATG 
TACGCGCCGC CGATCCGCTA G

Protein sequence

MKCVFTAIFA IVAGISLQPA SAQEQESAKA KTTLEAVKAR GALSCGVSQG LPGFSAPDDK 
GNWTGLDVDI CRAIAAVVFN DPTKVKFVPL SAKDRFIALQ SGEIDVLSRD TTWTLSRDTS 
LGANFTGVTY YDGQGFLIRK SLKVNSALEL NSASVCVQTG TTNEQNLADY FKSNKMKYEV 
IAFSTADETI KAYESGRCDV FTSDISQLYA QRLKLINPAD HAVLPEVISK EPHATMVRHG 
DDQWFDLVKW TLFAMINAEE LGITKKNVDE MARSENPELK RIFGTDGNFG EQLGVTKDWV 
SRIIKAVGNY GESFDRNVGA GSPLGIARGL NKLWNQGGIM YAPPIR