Gene Noc_1347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1347
Symbol
ID	3706111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1495811
End bp	1496818
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	53%
IMG OID	637737843
Product	glucokinase
Protein accession	YP_343372
Protein GI	77164847
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.836819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT TGGCTGCGGA TATTGGAGGA ACCAAAACCT TACTTCAGAT CGCTGACTGG 
GGGGAAAACA CTCCGCAGGT TCTTGCGGAA CAGCGTTATC TCAGCGGTGA TTATTCAAGC 
TTTGATGATC TCCTGCGAAC ATTTTTGACA GAGACGAGCA GTACAGGAAA CGGCCTTAGG 
GGTGCTTGTT TTGCTGTAGC AGGCGTCGTG ACGCAAGGCG TGGCGACGGC CACTAATCTC 
CCCTGGCGGC TGGATGCAAC ACATTTGGAG GCAACATTCG AGCTGCCTCA AGTGGTTTTA 
ATCAATGATT TCACGGCCAT CGGCTATGGC ATTGAAGGTC TAACGCCAGA CGATTTCGCA 
ATACTCCAGT CAGGCAAGCC GGAAGCCGCC GCTCCCCAGG CGGTTATTGG CGCTGGGACC 
GGGCTTGGAC AGGCATTGCT CGTATGGCAG GAGCAAACGG GTCACTACCA GGTTTTACCT 
ACTGAAGGAG GTCATGTAGA CTTTGCCCCT CAGGGAAAAC TCCAGATTGC ATTGCTGACT 
TATCTTTCTC GTCAGTTAGA CCATGTTTCC TACGAACGGG TATTATCAGG CGGCGGCTTA 
GTCACGCTCT ACCATTTTTT GAAGGAAACC AGCGGCATGG CTGAAAGCCC GGCCTTGAAA 
AAGGCGTTGA GCGAGGGCGA TCAGGCAGCG GCCATCAGCC GCTCTGCTCT GGAGCATGGA 
GACCCGTTAG CAGGACAAGC GTTGGATCTG CTGGTCCAGA TCTATGGCGC GCAAGCGGGC 
AATTTAGCCC TAGCTTGTTT ACCGCGGGGA GGACTTTTCG TTGCTGGCGG CATCGCGCCC 
AAGATCCTCG AACGCCTGCA GGCGGGCGGA TTTATGGAGG CTTTCCTAAG TAAAGGACGA 
CTCTCTGAGC TTATGCAACA AATCCCTGTC AAGGTCATAT TGGAGTCCAA GGTTGGCCTG 
CTGGGAGCCT CGCGATTAGC AATGAGATTA GCTTATGAGC AATTATAG

Protein sequence

MKVLAADIGG TKTLLQIADW GENTPQVLAE QRYLSGDYSS FDDLLRTFLT ETSSTGNGLR 
GACFAVAGVV TQGVATATNL PWRLDATHLE ATFELPQVVL INDFTAIGYG IEGLTPDDFA 
ILQSGKPEAA APQAVIGAGT GLGQALLVWQ EQTGHYQVLP TEGGHVDFAP QGKLQIALLT 
YLSRQLDHVS YERVLSGGGL VTLYHFLKET SGMAESPALK KALSEGDQAA AISRSALEHG 
DPLAGQALDL LVQIYGAQAG NLALACLPRG GLFVAGGIAP KILERLQAGG FMEAFLSKGR 
LSELMQQIPV KVILESKVGL LGASRLAMRL AYEQL