Gene Nwi_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1070
Symbol
ID	3674267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	1170260
End bp	1171240
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	637712620
Product	ADP-L-glycero-D-manno-heptose-6-epimerase
Protein accession	YP_317684
Protein GI	75675263
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.43387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.199498
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTTG TAACCGGAGG CGCCGGTTTT ATCGGATCGA ATCTCGTGGC CGCGTTGAAT 
GACGCCGGGC GAGGCGATGT GGTTGTGTGC GATGCGCTGG GGCATGACGG CAAGTGGCGC 
AACCTCGCCA AACGGCAGCT TGCGGATGTC GTTCCGCCCG CGGAACTGAC GTGTTGGCTC 
GATGGCCGCC GCCTCGACGC CGTCTTTCAT CTCGGCGCGA TCTCCGAGAC GACCGCGACC 
GATGGCGATC TCGTCATCGA GACCAATTTC CGGCTGTCGC TGCGATTGCT CGACTGGTGC 
GCCGGGACCG CGACGCCTTT CATCTATGCC TCGTCGGCAT CGACTTACGG CGACGGCGCG 
CAGGGCTTTC GCGACGATCA ATCGTTGGCC GCGTTGCGCG CGCTACGGCC GATGAATCTC 
TACGGCTGGA GCAAGCACCT GTTCGACATG GCCGTCGTGG GCCGCGCCGC CCAAGGCGGT 
GCTTTGCCGC CGCAATGGGC CGGCCTGAAG TTCTTCAACG TGTTCGGACC GAATGAGTAT 
CACAAAGGCT CCATGATGAG CGTGCTGACG CGTCGTTTCG ACGACGTCAA GGCGGGTCGT 
CCTGTGCAGT TGTTCAAGTC GCATCGGGGG GGCATCGCCG ACGGCGATCA GCGCCGGGAC 
TTCATCTACG TCGACGACGT CGTCCGCGTG ATGATGTGGC TGCTGGCCAC GCCTTCCGTG 
AGCGGCCTTT TCAATGTAGG AACCGGCAAG GCCCGTAGTT TTCGCGACCT GATGACGGCG 
GCCTATGCTT CGCTCGGCGC AAGGCCGAAC ATCGAATATA TCGATATGCC CGAACAGATT 
CGCGGCGCTT ACCAGTACTT TACGCAGGCC GATGTCGCCC GCTTGCAAGG CGCGGGCTAT 
AACGGCGGCT TCACGCCTCT GGAAGAAGCC GTGGATGCCT ATGTCAAAGG CTATCTCGAT 
CGCGACGATC GCTTTCGCTG A

Protein sequence

MLLVTGGAGF IGSNLVAALN DAGRGDVVVC DALGHDGKWR NLAKRQLADV VPPAELTCWL 
DGRRLDAVFH LGAISETTAT DGDLVIETNF RLSLRLLDWC AGTATPFIYA SSASTYGDGA 
QGFRDDQSLA ALRALRPMNL YGWSKHLFDM AVVGRAAQGG ALPPQWAGLK FFNVFGPNEY 
HKGSMMSVLT RRFDDVKAGR PVQLFKSHRG GIADGDQRRD FIYVDDVVRV MMWLLATPSV 
SGLFNVGTGK ARSFRDLMTA AYASLGARPN IEYIDMPEQI RGAYQYFTQA DVARLQGAGY 
NGGFTPLEEA VDAYVKGYLD RDDRFR