Gene Nwi_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1104
Symbol
ID	3677288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	1215795
End bp	1217366
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	64%
IMG OID	637712654
Product	hypothetical protein
Protein accession	YP_317718
Protein GI	75675297
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.926496
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.217444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGATA TTGTTCTCTC CGCATCGGTA CGCCAGAATC TGCTTTCGCT TCAGTCGACG 
GCTGAACTGC TCTCGACGAC CCAGACCCGC CTTGCCACCG GCAAGAAGGT GAACTCGGCG 
CTTGATAATC CGACGAACTT CTTCACCGCC GCCGGCCTCG ACGCCCGCGC CAGCGACATC 
AACAACCTTC TGGATTCGAT CGGCAACGGC GTGCAGGTGC TGCAGGCCGC CAATACGGGT 
ATCACCTCGC TGCAGAAGCT GGTCGATACC GCGAAGTCGA TCGCCAACCA GGCGCTGCAG 
GCGACCTCGG GCTATTCCAC CAAGTCGCAG GCGACCACCG CCGCCATCAC CGGCGCGACG 
GCCGACAACC TGCTCGGGCC GGGTGGCGCT CCGACCGATG CTGCCGCTAC TCCCGGCTCT 
GTCGTCAACA ACAGCCTGAC CGTTCCCGCA CCGATCACCG CGGCGACGAC GTTGTCTGGC 
GGTGTGAATA CCGACTCGCT CGCCACGGAC TTCATTGCTG GCGATACGAT CGTCGTCAAC 
GGCACGACGA TCAATTTCGT GGCTTCCGGC GCTACCGGCA ACGACCTCAA CATCACCGAC 
ACCGTCGGCG ACGTGTTGGC CAGGATTGAC TCGATCACGG GCGGTACGTC CACCATCTCC 
GGCGGTGCGA TTACGCTTCA CACCGGCACG GCCAGCGATC TGACCATCAG CGGCTCGGGC 
CTTGCCAAGC TCGGTTTGAC CGCGGGCACC ACCGCGCGAA CCCCCGGCGC TCCGGCCGCG 
CTCGACGGCA AGACGCTAAC GATTGGCGCA ACCGATGGCG GCACGGCGAC CAGCATCACG 
TTTGGTACCG GCACCGGCCA GATCAATACG CTCGACCAGT TGAACACGGC GCTCGCCGCG 
AACAACCTGA CCGCCTCGAT CAACTCGGCG GGCGCGATCA CCTTCACCAC GACCAACGAT 
CACGCGTCCG CGACGATCGG TGCGTTTGGT GGCGATGCGA CCACCGATCC GAATACGTTC 
GGCGCGATGA CGGCTTCCGC TCCGGTCGAG GACGCCAACG CGCAGAACAC CCGCGCCACG 
CTGATTGGCC AGTACAATCA GGTCATCGAC CAGATCCGCA CCACCGCGCA GGATGCTTCC 
TTCAACGGCA TCAACCTGCT CAACGGTGAC CAGCTCAAGC TGGTGTTCAA CGAAACCGGC 
AAATCGACGC TGACCATCCA GGGCGTGACC TTCGATCCGG CGGGCCTCGG CCTGTCGTCG 
CTGGCCAAGG GCACGGACTT CCTGGACAAC GCTTCGACCA ACGCCGTTCT GGACTCGCTC 
AACACCGCGT CCAGCACGCT GCGCTCGCAG GCGTCGACCT TCGGTTCCAA CCTGTCGATC 
GTGCAGATCC GTCAGGACTT CTCGAAGAAC CTGATCAACG TGCTGCAGAC GGGATCGGCG 
AACCTGACGC TTGCCGATAC CAACGAGGAA GCGGCGAACA GCCAGGCGCT GGCCACCCGC 
CAGTCGATCG CGGTGTCGGC GCTGGCGCTG GCCAACCAGT CGCAGCAGAG CGTGTTGCAA 
CTGCTCCGCT GA

Protein sequence

MSDIVLSASV RQNLLSLQST AELLSTTQTR LATGKKVNSA LDNPTNFFTA AGLDARASDI 
NNLLDSIGNG VQVLQAANTG ITSLQKLVDT AKSIANQALQ ATSGYSTKSQ ATTAAITGAT 
ADNLLGPGGA PTDAAATPGS VVNNSLTVPA PITAATTLSG GVNTDSLATD FIAGDTIVVN 
GTTINFVASG ATGNDLNITD TVGDVLARID SITGGTSTIS GGAITLHTGT ASDLTISGSG 
LAKLGLTAGT TARTPGAPAA LDGKTLTIGA TDGGTATSIT FGTGTGQINT LDQLNTALAA 
NNLTASINSA GAITFTTTND HASATIGAFG GDATTDPNTF GAMTASAPVE DANAQNTRAT 
LIGQYNQVID QIRTTAQDAS FNGINLLNGD QLKLVFNETG KSTLTIQGVT FDPAGLGLSS 
LAKGTDFLDN ASTNAVLDSL NTASSTLRSQ ASTFGSNLSI VQIRQDFSKN LINVLQTGSA 
NLTLADTNEE AANSQALATR QSIAVSALAL ANQSQQSVLQ LLR