Gene Nwi_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2010
Symbol
ID	3674198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	2198062
End bp	2199180
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	68%
IMG OID	637713574
Product	SMF protein
Protein accession	YP_318621
Protein GI	75676200
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.272582
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACATCC GGGATCCAGA CAGACGGCTG AGCGAAGCGC AGCGGACCGA CTGGCTGCGG 
CTGATCCGGT CCGATAATGT CGGGCCGCGA ACCTTTCGTT CGCTCGTGAA CCACTTCGGC 
AGCGCCAGCG AGGCGCTCGT CCGCCTACCC GATCTGGCGC GGCGTGGCGG CGCTTCCCGC 
CCCAGCCGGC TTTGCACGGA AGCCGAGGCG CGGAACGAAC TGGCGGCCGC GCGGCGGATC 
GGCGTCAGCC TGCTGGCGCC GGGAGAGGCC GGCTATCCCC CGCACCTTGC AACGATCGAC 
GACGCCCCGC CGCTGCTTGG CGCGCGCGGC AACCTCGATG TCATGGAGCG TCCCATGATC 
GCCATCGTCG GTTCACGCAA CGCATCGGGC GCCGGTCACA AGTTCGCGCA AACGCTGGCG 
CATGATCTCG GTGATACCGG TTTCGTCATC GTATCGGGGC TGGCGCGCGG CATCGATCAG 
GCGGCGCATC GCGCCAGCGT GGCGCGCGGC ACCGTCGCGG TGCTTGCCGG TGGCCACGAC 
CGCATCTATC CATTGGAACA TGAGGATCTG CTGGCAGCCG TATTGGAAAG CGGCGGCGCG 
ATTTCTGAGA TGCCGATGGG GCATGTCCCG CGGGCCCGCG ATTTCCCGCG GCGCAACCGC 
CTGATCTCGG GCGCCGCGAT CGGCGTTGTC GTGGTCGAGG CGGCGCATCG TTCCGGCTCT 
CTGATCACCG CCCGCATGGC CGCCGAGCAG GGCCGCGAGG TTTTCGCCGT GCCGGGCTCA 
CCGCTCGATC CGCGCGCCAC CGGCACCAAT GATCTCATCA AGCAGGGCGC GACGCTGATC 
ACCGAGGCAG CCGACGTCAT TAATGCTGTC CGGCCGATTA TAAGACGGCC GGTTGATCTG 
CCCGCCGAAG AACCGGAGCC CGGCGAGCCC TGGACCGAAG AGCCCGCCGC AAGCGACCGT 
GCGCGGATCA TCGCCTTGCT CGGTCCGGCG CCGATCGGAC TTGACGATCT GATTCGGATG 
GCGAATGCCC CGCCGGCCGT CGTGCGCACG GTCCTGCTTG AACTGGAACT GGCCGGACGG 
CTGGAGCGCC ATGGCGGCGG CCTGGTATCA ATGATGTGA

Protein sequence

MNIRDPDRRL SEAQRTDWLR LIRSDNVGPR TFRSLVNHFG SASEALVRLP DLARRGGASR 
PSRLCTEAEA RNELAAARRI GVSLLAPGEA GYPPHLATID DAPPLLGARG NLDVMERPMI 
AIVGSRNASG AGHKFAQTLA HDLGDTGFVI VSGLARGIDQ AAHRASVARG TVAVLAGGHD 
RIYPLEHEDL LAAVLESGGA ISEMPMGHVP RARDFPRRNR LISGAAIGVV VVEAAHRSGS 
LITARMAAEQ GREVFAVPGS PLDPRATGTN DLIKQGATLI TEAADVINAV RPIIRRPVDL 
PAEEPEPGEP WTEEPAASDR ARIIALLGPA PIGLDDLIRM ANAPPAVVRT VLLELELAGR 
LERHGGGLVS MM