Gene Nwi_2739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2739
Symbol
ID	3676333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	2974610
End bp	2975650
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	637714306
Product	Sel1 repeat-containing protein
Protein accession	YP_319344
Protein GI	75676923
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0269187
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.433518
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTGC TGCGTCCGGT CGCCATCGCC GCCGGCCTTC TCATGCTCGG GGAAAGCGCG 
GCTGCGCAGC TCCAGCCCTC GCCGTCGGCC GATGCGCCGT CCGCGGGCAA GAGCGTCAAG 
ACCAAGGCCA TCAAACCGCC GCCGCCAACG CCGCCCGCCG GGCTGGAGCC GGACAACAAG 
GCGAACGCGC AGGTTGCTGA CGATCCGAAC GCGGATCCGG TTTACGGCGC CTATCAGCGC 
GGCCTTTACA AGACGGCGTT CGATCTCGCC TTGAAACGAG CACAGGAGGA CAAGAACCCC 
GCCGCCATGA CCATGCTCGG CGAACTCTAC GCCAATGGGC TCGGCGTCAG GCGCGACTAC 
GGCAAGGCCA TCGAATGGCA TCAACGTGCG GCCGATCTGG GCGATCGAGA GGCCATGTTC 
GCGCTCGCCA TGCTTCGCAT CAGCGGACGC GGCGGACCTC CCGACAGGAC GGGCGCGGTG 
AAATGGCTGG CGGCGTCGGC CAAGCTCGGC CAGCCCAAGG CCGCCTACAA TCTGGCGCTT 
CTCCACATGG ACGGGCAAAC GCTGCCGCAG GATTTCAAGC GCGCCGCCGA ACTGTTGCGA 
TTCGCAGCCG ACGCCGGCAG TCCGGAAGCG CAGTATGCGC TGGCCACTTT CTACAAGGAA 
GGCACCGGCG TCGAAAAGAA CCTCTACAAG TCGGTGCGGC TGTTGCAGGC CGCCTCGCTC 
GCCGGCAACG TCGACGCCGA GGTCGAATAT GCAATCGCGT TGTTCAACGG CAGCGGCACC 
GGGAAAAACG AGGCGGCCGC GGTATCGCTG CTGCGCAAAG CCGCCAGGCG AAACAGCGCG 
ATCGCCCAAA ATCGTCTCGC CCACGCCCTT GTCGAAGGCA TGGGCGTCCC GATGGACAAG 
GTCGAAGGCC TGAAATGGCA CATCGTGGCG AAAACCGGCG GCAAGGGCGA TCTGAAGCTC 
GACGCGGCGA TGGCGCAGGC GACGCCCGAA GAACGCGCCG GTGCGGAGAG CGCCGCGCGC 
AAATGGCTTG GAATCAAATG A

Protein sequence

MSLLRPVAIA AGLLMLGESA AAQLQPSPSA DAPSAGKSVK TKAIKPPPPT PPAGLEPDNK 
ANAQVADDPN ADPVYGAYQR GLYKTAFDLA LKRAQEDKNP AAMTMLGELY ANGLGVRRDY 
GKAIEWHQRA ADLGDREAMF ALAMLRISGR GGPPDRTGAV KWLAASAKLG QPKAAYNLAL 
LHMDGQTLPQ DFKRAAELLR FAADAGSPEA QYALATFYKE GTGVEKNLYK SVRLLQAASL 
AGNVDAEVEY AIALFNGSGT GKNEAAAVSL LRKAARRNSA IAQNRLAHAL VEGMGVPMDK 
VEGLKWHIVA KTGGKGDLKL DAAMAQATPE ERAGAESAAR KWLGIK