Gene Noc_1697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1697
Symbol
ID	3705610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1899493
End bp	1900773
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	637738178
Product	carbohydrate kinase, FGGY
Protein accession	YP_343699
Protein GI	77165174
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.667396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTCTG ATCTTTTTCT TGGTATTGAC ATGGGCACTT CAGGCTGCCG AATCATTGCT 
ATCAATGAGA TGGGGGAAAT CCGGGGCCGC AGCCATGTTT CCCTGCCTCC TCCCCAGCGG 
CAAGGAAGGG CGATAGAACA GGATCCAGAG CAATGGTGGC AAGCCATCAA GCAAGCTTTT 
ACAAATCTGT TTCAGGAGGT GCCCGCCAAG GCAGTTCGCT CCCTTGCTGT TGATGGAACT 
TCCGGTACGG TGGTCTTAGT AGATAAAAAA GGGAGTCCTT TAACTCCCGC CTTACTCTAT 
AATGACAGCC GCAACCATGC TGAAGCGCAC CTCATTGCCG AGCAGGCCCC TCCCCATAGC 
GGCGCCTTGG GTCCCACTTC TAGTCTAGCG AAACTGCTCT ATTTGCAGAC CCGTCCAGAG 
GCGCTTCAGG CAGCTTACCT GCTGCATCAA GCAGATTGGA TCGCCTTCCG TTTAGGGGCA 
AAGTTGGGGA TCAGCGACGA AAATAATTGC CTTAAGACAG GATATGACTC CAACCAGCAA 
GAATGGCCTG ACTGGCTCGA CCGAGTGGGT GTACGCCGCG AACTGCTGCC GACGGTAGTT 
CCTCCCGGAA CCCTAATTGG CACCATTGAC CCCTCCCATA CAGAAACGTT TCAAATCCCC 
CCCCAGGCGA AGTTAGTGGC GGGCACCACC GATAGTATTG CTGCCTTTAT AGCTACCGGG 
GCGGGAAAAC CAGGAGACGC TGTCACCTCC CTTGGTTCTA CCTTAGCGCT CAAGGTAGCC 
TCCGAACGCC CCATTTTTAG CGCAAAATAT GGCATTTACA GCCATCGCCT AGGCAGGCTT 
TGGCTGGCTG GTGGCGCTTC TAATAGTGGT GGCATTGTTC TGCGGCAGTA TTTTACTCAA 
GCTCAACTCG ATGAGATGAC TCCCCATCTT CAGCCACAGC AAATTACGGG ATTGAATTAC 
TATCCTCTAC CCGCCCAGGG CGAGCGCTTT CCCGTTCCAG ACCCCCACTA TTCGCCATGT 
CTCGCTCCCC GTCCCCGTGA TGATATAACC TTCTTTCAAG CTATTCTGGA GGGTATTGCC 
CGTATTGAAG CCCAAGGTTA TCGTCAACTT CAATCGCTAG GCGCCCCTTT CCCCAGCCTG 
GTGAAAACCA CTGGCGGAGG TGCTCACAAT CCCGCTTGGT TGCAAATAAG GGAACACACC 
CTTCGGGTTC CGGTGATTGC TGCCCATGAG ACCGAGGCCG CCTATGGGAG CGCATTATTA 
GCGCGTCAGG CTCTCTCCTG A

Protein sequence

MSSDLFLGID MGTSGCRIIA INEMGEIRGR SHVSLPPPQR QGRAIEQDPE QWWQAIKQAF 
TNLFQEVPAK AVRSLAVDGT SGTVVLVDKK GSPLTPALLY NDSRNHAEAH LIAEQAPPHS 
GALGPTSSLA KLLYLQTRPE ALQAAYLLHQ ADWIAFRLGA KLGISDENNC LKTGYDSNQQ 
EWPDWLDRVG VRRELLPTVV PPGTLIGTID PSHTETFQIP PQAKLVAGTT DSIAAFIATG 
AGKPGDAVTS LGSTLALKVA SERPIFSAKY GIYSHRLGRL WLAGGASNSG GIVLRQYFTQ 
AQLDEMTPHL QPQQITGLNY YPLPAQGERF PVPDPHYSPC LAPRPRDDIT FFQAILEGIA 
RIEAQGYRQL QSLGAPFPSL VKTTGGGAHN PAWLQIREHT LRVPVIAAHE TEAAYGSALL 
ARQALS