Gene Nwi_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2072
Symbol
ID	3675487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	-
Start bp	2269061
End bp	2271421
Gene Length	2361 bp
Protein Length	786 aa
Translation table	11
GC content	57%
IMG OID	637713638
Product	TonB-dependent receptor
Protein accession	YP_318682
Protein GI	75676261
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.516649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAGAA TATTGTTCAT CGGCGCGCTG CTTGGCGGCG AGTCGTACGG CGCGTTGGCC 
GTAGCGCAGG ATTCAACGAA TCTTCCGCCC GTGACCATTG TCAGCGATGG TCAGCCGAGA 
AATGTGCGGC AGAACAGCAC GACGAATGCA CGGGGCCGGA CCGCGCGACG TGCGCGACAG 
GCTGTGCCGA GCAATCAGCA ACCTGTCCCG CAGCAACAGC AACAATCTGG CGGTGTTCGG 
GCATCGCAAA ACTCCGTCCT CAGCACCACG CCGCAGTTAG CCGGCGCCAG CAGCGTGACA 
CAGCAGGGCA TCGCGATTCT GGGCGGACCG GCGCAGACGA GCTTCTACCA GCCGCTGGCC 
CTGATTCCCT CTGTTTCGGT TCAGACACCG GATCCGTATG GTTTGAATAC GACGCGAAAC 
ATTAATATTC GCGGCAAGGG AGATTTTCAT CTTTCACGCA CGATCGACGG CTTACCGCTA 
ATGGGAATTG TGGGCGGCTC CGATCTGTTC GATCTGGAGA ACATTGGGCG TATCGACGTT 
TATCGCGGTG CCGTGCCGTC CGACAAAGGC ATTGGCCTGT CGAACGCGAC CGGCGTGATC 
AACCAGCTCA CGCTGAGACC ACAGGATAAA GCTGGCTTCA CGGCGCGCCA AGCCTTCGGC 
ACCGACAGCT TCTATAAGAC ATTCGTTCGA ATCGACAGCG GCCTGAATCC GGAGACGGCA 
ACCAAAGCCT TTCTGTCCGG GTCCAATATC GGTGTCGACA AGTGGACGGG CGCTGGCGAC 
CAGAAACGCC AGAACGTCAC GTTCGGGTTG AGCCAGGATT TCGGTGACCG TATCACCCTC 
GACGTTACCG CGGTCTACAA CAACTACGCC GAGAATTTCT TTCGAGCGCT AACGTATCCT 
CAGACCACAA ATCTAAGAAA CAACTATAGT CATGACTTCA ACACCACGCT GACGGGCGTC 
GCGGCAACCG ACGTCAACTA CTACAAGTTT AACCGGATGA ACGCTAAAAC GTTCGCGACT 
TTCGCAAAGC TTGATTATAA CTTTGCCGAA GGACAGCATC TGCTGTTCAA GCCATACTAC 
TGGGACAACG ACACCACGCG ATACAACGCG GCCGGAAGTA ACGTTCAGAT CTGGCGTCAG 
CAGAACCAGA ACGTCGGTAG CGTTTTCGAG TACGCCGGGC AGTTTCCCTG GGGAACCGAC 
GTCGTTGTCG GATACTGGTG GCAATCGATG AAGCCGCCGC CACCTCCGAC GGATCAGCGG 
CGTTTCACCG TGGATGCGGC CGGCGGACTT GATTTCTCCC ACTGGCAGAG TCTTGCGAGA 
ATCGACAACT TCAGCGTCAA CAGTCCGTAC TTTCAGGTTT CGCAGAATTT TGGGTCAACC 
TTTGTGACCA GCGGTCTGCG CTACATGGTT CTCGGGGCAC CGCAGATGTT GTACTACAAC 
ACTGCGGGAA TTTCTGACGG CACTCACGGT CAGGCGCTGG CATTGAACCC CGCGATCTAT 
CCCGATGCCA CCCTGGCTGC ACGGGACTAT ACCGCATGGC TTCCCAACGT CGCGATTCGT 
CACGATCTCA ACCCGGCTCT CAGCGTGAAT TTCAGCTATG GACGCAGATT CGGCCGCCCG 
GATTGGGGAC CGCAAGCAAG CAATTACATC AGCAACCGCA CGGTGTTCAC CGCGAGGGGG 
TTCTCGCTGC AATCGCTGGT CGACAAGGTG CGGCCGGAAA TCTCTGATCA GTTTGATGCT 
TCGCTACGCT TTAGCCAGTA CGGGCTGACT GTGATCCCAA CCCTGTTCTA CGCCAAATAC 
CAGAACAAGC AGGTCAAGGT CATCGATCCA TCGATCGGCC CGAACATCGC ATACTTTCAA 
GGCACCGGAT CGAGCACCGG ATACGGCTTT GAGCTTGAAG CGAACTATAG GTTCGACGAG 
CAGTTCTCAG TCTTCGGTTC GACGACGCTG GCATCCGAAA CATTCGATTC CGATACGCCA 
ACCCTGAGCG GCGGCGCCAT GCTGGCGACC AAGGGTAAGC AGATCCCGAA CACGCCGCAA 
GTCATGATAA AGGGCGGAGT AACCTACCAG GTGGACCGTC TGGCGATCAT GCCGATCGTA 
CGTTACATCG GCCCGCGTTT CGGTGAAGCC GCCAACACCC AGCGTGTATC CGGATACACC 
GTTGCGGATT TGACGATGTC CTATGATCTC GGGTCCCATT TTGGTGTCGA ATCCCTGAAT 
GCGAGCTTCT CGATCCAGAA CATCTTTGAT CGTCAGTACA TCTCACAGAT CTCTCCCAGC 
GACATCGATC TGAGCGCGGG CGCGACCTAT TTCCTGGGAG CGCCGCGAAC GGTTGTCGGA 
TCACTGTCGA TGAAATTCTG A

Protein sequence

MKRILFIGAL LGGESYGALA VAQDSTNLPP VTIVSDGQPR NVRQNSTTNA RGRTARRARQ 
AVPSNQQPVP QQQQQSGGVR ASQNSVLSTT PQLAGASSVT QQGIAILGGP AQTSFYQPLA 
LIPSVSVQTP DPYGLNTTRN INIRGKGDFH LSRTIDGLPL MGIVGGSDLF DLENIGRIDV 
YRGAVPSDKG IGLSNATGVI NQLTLRPQDK AGFTARQAFG TDSFYKTFVR IDSGLNPETA 
TKAFLSGSNI GVDKWTGAGD QKRQNVTFGL SQDFGDRITL DVTAVYNNYA ENFFRALTYP 
QTTNLRNNYS HDFNTTLTGV AATDVNYYKF NRMNAKTFAT FAKLDYNFAE GQHLLFKPYY 
WDNDTTRYNA AGSNVQIWRQ QNQNVGSVFE YAGQFPWGTD VVVGYWWQSM KPPPPPTDQR 
RFTVDAAGGL DFSHWQSLAR IDNFSVNSPY FQVSQNFGST FVTSGLRYMV LGAPQMLYYN 
TAGISDGTHG QALALNPAIY PDATLAARDY TAWLPNVAIR HDLNPALSVN FSYGRRFGRP 
DWGPQASNYI SNRTVFTARG FSLQSLVDKV RPEISDQFDA SLRFSQYGLT VIPTLFYAKY 
QNKQVKVIDP SIGPNIAYFQ GTGSSTGYGF ELEANYRFDE QFSVFGSTTL ASETFDSDTP 
TLSGGAMLAT KGKQIPNTPQ VMIKGGVTYQ VDRLAIMPIV RYIGPRFGEA ANTQRVSGYT 
VADLTMSYDL GSHFGVESLN ASFSIQNIFD RQYISQISPS DIDLSAGATY FLGAPRTVVG 
SLSMKF