Gene Nwi_1210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1210
Symbol
ID	3675669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	1328903
End bp	1330894
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	58%
IMG OID	637712760
Product	glycoside hydrolase family protein
Protein accession	YP_317824
Protein GI	75675403
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.495864
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTCAG GTTCAGGGTC GGGGATGACT ATCCATTCAA AAGCGCAAGA TCTGGGCATC 
AACCTGGACT TTGTTGACGG ACTCGGCCGC CACCATCTCC TGGATGATGT TCGGTTGCGT 
CCCATTGTTG ATGGTCTACC ATCGCCTCCG CACCATCGTT TCCTAAAACA TCCCGTGGTC 
ATCGTTACCA ATGCGGACGA TTTTAGCGTG CCGGTCGGAG CAGAGGCGAA CGGCGTTTTC 
TGGCGGCTCG TGGAAGGTCA CACGGTGCTC GCCCAAGGAT ACATTTCTTC GGCAAGGATA 
GATCTCCCGC GCTGGATATC GGTCGGCACT TATCGGCTGG AACTCGAAAG CGAGAAGGGC 
GGCATTCTCG ATTCGGTTCC GGTTCTGGTC ACGCCCGAAA GGGCCTATCA AGGCTCATTC 
GAGCGCGTAT GGATCCTGTC CGTTCAACTG TACGCGCTGA CATCGTCGCG CAACTGGGGC 
ATTGGTGACT TCACAGATCT GGTATCGCTG ATCGAACTCA CCTCGGATTG GGGCTGCCAT 
GGCATCGGTC TCAATCCGCT CCATGCTCTG TTCGATGATC GTCCACTAGA ATGCAGTCCC 
TATGCGCCGA ATAGCCGCCT GTTTCTCAAT CCGCTTTATG TCGATCCCGA GCGGGTGCCG 
AATTGTTCGC GCGTGTGGCT AAAACGACAG CGTGAACAAC TCGATCGGGT CCGGGAGGGC 
GAACTCGTCG ATTACGCGGC CGTCGCCGAA CTGAAATTCG CAGCGTTCCG GCATGCGTTT 
TCGAGGTTTC GACGTGATCA CGCGGCGCAG GCCGAGTTCG ACCTCTTCAG GGAGGAGAGA 
GGCCAACTGT TGAAACGATA TGCCTGCTTC GAGGTGTTGC GGCGCCAGTT TGGTCCATCG 
CCCTGGTGGT CGTGGCCCGA CGAGTGGCGC CGTCCGACTG ACGCCGGGAT TCAAGCCATA 
TCCAGCGGCT CACGGCGCGA GGAAGTGAAG TTCGTCGAGT TCATGCAATG GTGCGCAGCG 
TCCCAACTAC AGTCATGCGC CGATCTTGCC GCCGAACGGG GCATGACGGT CGGGCTCTAT 
CTGGATGTCG CCGTCGGTGT GCAGGCCGGC GGATTCGACG CCTGGAATGA GCAGACCTCC 
ATTTCGCGCG CGCTGTCGGT TGGGGCGCCG CCTGATCAAC TCAACACGGC GGGGCAGGAT 
TGGGGATTGG CGGGATTCAA TGCCGCTGGC CTAGAGGCGA GCGACTTCGC ACCGTTTCGA 
GAGATGCTGC GCGCTTCCAT GCGTTTCGCC GGAGCCATAC GGTTGGATCA TGTGTTCGGT 
CTCAGCCGCC TCTACCTGAT ACCGGCCGGC GGATCGCCTT TGCAGGGAGC ATATGTAAAG 
ATGCCGCTGC AGGCCCTGCT CGGCGTTATC GCGCAAGAGA GCGTCAGCCA GCGTTGCATC 
ATCATCGGCG AGGATCTCGG AACGGTACCG GATGGCTTTC GTGAAAAACT CGCTGATTGG 
GGTGTGTGGT CCTACAAAGT GATGATGTTT GAACGCGGCA ACGATGGTGC TTTCATCGAA 
GCGTCAAAAT ATGCCGAGAA CGCGCTCGTT ACTTTCACGA CGCATGACCT TGCATCCTTC 
GCCGGCTGGC AAACGCATTC TGACCTCAGG GTCAAACGCG AGCTTGGGAT CGAGCCCGGC 
GAAACGGATG CGGAGCGGAC GGATGCGCGC CATGCATTCG AGTGGAAGCT CGGCGAAGAA 
CACATCGCAG TGAAGAATTT TATCGGAGCC GTGGAGTTTC TTGCGCGAAC GCCGTCCCGT 
ATTCTCGCGA TCGCGCTCGA CGATTTGATC GAACTGCGGG ATCAACCGAA TATTCCAGGT 
ACGTTGAATG AGCATCCCAA CTGGCGGAGA CGGACTCCAG TCAGGTTGGA AGATTTAGGC 
GGATGCATTG ACCTCGACGC GCTTCGACAC GCGCTCCGTG GCCGCTGCAA CAGCGTTCAC 
GATAATCCAT GA

Protein sequence

MPSGSGSGMT IHSKAQDLGI NLDFVDGLGR HHLLDDVRLR PIVDGLPSPP HHRFLKHPVV 
IVTNADDFSV PVGAEANGVF WRLVEGHTVL AQGYISSARI DLPRWISVGT YRLELESEKG 
GILDSVPVLV TPERAYQGSF ERVWILSVQL YALTSSRNWG IGDFTDLVSL IELTSDWGCH 
GIGLNPLHAL FDDRPLECSP YAPNSRLFLN PLYVDPERVP NCSRVWLKRQ REQLDRVREG 
ELVDYAAVAE LKFAAFRHAF SRFRRDHAAQ AEFDLFREER GQLLKRYACF EVLRRQFGPS 
PWWSWPDEWR RPTDAGIQAI SSGSRREEVK FVEFMQWCAA SQLQSCADLA AERGMTVGLY 
LDVAVGVQAG GFDAWNEQTS ISRALSVGAP PDQLNTAGQD WGLAGFNAAG LEASDFAPFR 
EMLRASMRFA GAIRLDHVFG LSRLYLIPAG GSPLQGAYVK MPLQALLGVI AQESVSQRCI 
IIGEDLGTVP DGFREKLADW GVWSYKVMMF ERGNDGAFIE ASKYAENALV TFTTHDLASF 
AGWQTHSDLR VKRELGIEPG ETDAERTDAR HAFEWKLGEE HIAVKNFIGA VEFLARTPSR 
ILAIALDDLI ELRDQPNIPG TLNEHPNWRR RTPVRLEDLG GCIDLDALRH ALRGRCNSVH 
DNP