Gene Nwi_0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_0289
Symbol
ID	3677117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	327254
End bp	329152
Gene Length	1899 bp
Protein Length	632 aa
Translation table	11
GC content	64%
IMG OID	637711829
Product	extracellular solute-binding protein
Protein accession	YP_316908
Protein GI	75674487
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGGC CCAGCCGTCG GCAGGTGTTC GGTCTTGGGA TCGGTGCGGC AGGCGCGGCA 
TGGCTGCGGC CGGCCGTCGC CGTGGCCGCG AACGGCGCGG AGCCGAACCC GCATGGCGAA 
TCCCAAGGCC AATCTCACGG CATGTCGGCC TTCGGGGACC TGAAATATCC GGCTGATTTT 
CACCACTTCG ATTACGTCAA TCCGGACGCG CCGAAGGGCG GGCTGTTCGC GACCATTCCG 
TCGAGCCGCG CTTTCAATCA ATCGTTCCAG ACCTTCAACT CGCTCAACGC CTTTATCCTG 
AAGGGCGACG GCGCGCAGGG CATGGGGATG ACGTTCACGT CGCTGATGGC GCGCGCCGGT 
GACGAGCCCG ATGCGATGTA TGGCCTGGCG GCGAAATCGG TTCGCATCTC GGCCGATGGC 
CTGACCTACC GCTTCACGAT GCGGCCGGAG GCGCGGTTTC ATGACGGACA AAAAATTACC 
GCGCGCGATG CCGCCTTTTC CCTGATGGTC CTGAAGACCA AGGGTCATCC CCTGATCACG 
CAGCAGGTGC GCGACATGGT GAAGGCGGAA GCGCCCGACG ACGCGACGCT CGTGGTGACC 
TTCGCCGCGA AACGCGGTCG GGATGTGCCT TTGTTCGTCG CCGGCCTGCC GATCTTTTCG 
CAAGCCTATT ACACGGCGCG CCCGTTCGAT GAAACGACGC TCGACGTTCC GCTCGGCAGC 
GGGCCGTACA AGGTCGGCCG GTTCGAGGCA AATCGTTTCA TCGAATTCGA TCGCGTGAAG 
GATTGGTGGG GCGCGGACCT TCCGGTGTGC CGCGGCGCTT ACAACTTCGA TACGGTGCGA 
TTCGATTTCT ACCGCGACCG TGATGTGGCG TTCGAGGGCT TCACCGGCCG CAGTTATCTG 
TACCGCGAGG AGTTCACCTC CCGCATCTGG AATACGCGCT ATGATTTCCC GGCGATGACC 
GACGGCCGCG TCAAGCGCGA GCAATTGCCG GACGAGACGC CGTCCGGCGC GCAGGGCTGG 
TTCATCAACA CCCGCCGCGA CAAGTTCAAG GATCCTCGCG TCCGCGAAGC GCTCGACTGC 
GCCTTCGATT TCGAGTGGAC CAACAAGTCC ATCATGTACG GCGCCTATGT GCGGACGGTA 
TCGCCTTTCC AGAATTCCGA TCTGATGGCG AGCGGTCCGC CGTCGCAGGA GGAGGTGGCG 
TTGCTGGAGC CCTTCCGCGG CAAGGTGCCG GATGAAGTGT TCGGCAATCC CTACACTCCG 
CTCGTCTCGG ACGGATCGGG ACAGGACCGC AAGCAGTTGC GCAGGGCCGC GCAACTGCTC 
GACGAGGCAG GCTTTCATAT CAAGGACAGG AAGCGGATGA CCCCGCGGGG CGAGGTCTTC 
CGCCTCGAAT TCCTGCTCGA TGAGCCGGCC TTCCAGGCTC ACCACATGCC CTATATCAAG 
AATCTCCAGA CCCTCGGCAT CGAGGCGACG CTGCGGCTCG TGGACCCGGT TCAGTCGCGC 
TCGCGGCGCG ACGACTTCGA TTTCGACATC ATCATCGAAC GTTTCAGTTT CTCGACCATT 
CCAGGCGATT CGCTGCGGCC GTTCTTTTCG TCGCGCGCGG CGGCGACCAA GGGCTCGAAC 
AACCTGGCGG GCATCGCCGA TCCCGCGATC GATGCGCTGA TGGAGCAGGT CATCGTCGCC 
GACACCCGCG CCAGGCTCGT CTTCGCGGCG CGCGCGCTGG ATCGCGTGAT TCGCGCCGGC 
CGCTATTGGG TGCCGCAATG GTATTCGAAC ACGCACCGGC TGGCCTATTG GGATGTGTTC 
GCCCATCCGC CGAGCCTGCC GAAATACCTC GGCGTCATGG CGCCTGATAT CTGGTGGTCG 
ACACAGGCCC GGCCGGCATC ATCCGGGCAG GCGGGATAA

Protein sequence

MSRPSRRQVF GLGIGAAGAA WLRPAVAVAA NGAEPNPHGE SQGQSHGMSA FGDLKYPADF 
HHFDYVNPDA PKGGLFATIP SSRAFNQSFQ TFNSLNAFIL KGDGAQGMGM TFTSLMARAG 
DEPDAMYGLA AKSVRISADG LTYRFTMRPE ARFHDGQKIT ARDAAFSLMV LKTKGHPLIT 
QQVRDMVKAE APDDATLVVT FAAKRGRDVP LFVAGLPIFS QAYYTARPFD ETTLDVPLGS 
GPYKVGRFEA NRFIEFDRVK DWWGADLPVC RGAYNFDTVR FDFYRDRDVA FEGFTGRSYL 
YREEFTSRIW NTRYDFPAMT DGRVKREQLP DETPSGAQGW FINTRRDKFK DPRVREALDC 
AFDFEWTNKS IMYGAYVRTV SPFQNSDLMA SGPPSQEEVA LLEPFRGKVP DEVFGNPYTP 
LVSDGSGQDR KQLRRAAQLL DEAGFHIKDR KRMTPRGEVF RLEFLLDEPA FQAHHMPYIK 
NLQTLGIEAT LRLVDPVQSR SRRDDFDFDI IIERFSFSTI PGDSLRPFFS SRAAATKGSN 
NLAGIADPAI DALMEQVIVA DTRARLVFAA RALDRVIRAG RYWVPQWYSN THRLAYWDVF 
AHPPSLPKYL GVMAPDIWWS TQARPASSGQ AG