Gene Noc_1743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1743
Symbol
ID	3705004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	1958361
End bp	1960283
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	52%
IMG OID	637738226
Product	1-deoxy-D-xylulose-5-phosphate synthase
Protein accession	YP_343745
Protein GI	77165220
COG category	[H] Coenzyme transport and metabolism [I] Lipid transport and metabolism
COG ID	[COG1154] Deoxyxylulose-5-phosphate synthase
TIGRFAM ID	[TIGR00204] 1-deoxy-D-xylulose-5-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTCTG TAACTAGCTA TCCTCTATTA GAACAGATTG ATTCCCCGGA GCGTTTGCGC 
CGTTTGCCTG AGTCGGATCT AGAGACTCTC GCCGAGGAAT TGCGCGATTT TCTCCTTCAC 
TCCGTCGCTC GCAGTGGCGG ACACTTGGCT GCAGGTTTGG GGACTATCGA ATTGACGATC 
GCCCTACACT ATATTTTTGC CACTCCGGAA GATCGCCTGG TATGGGATGT AGGGCATCAA 
GCCTATCCCC ACAAAGTGCT CACAGGACGA CGGGAACGGT TGGGAACTAT CCGTCAAGCA 
GGCGGTTTGG CGCCCTTCCC CAGTCGTCAC GAGAGTCCTT ACGATACTTT TGGCGTGGGT 
CATTCTAGCA CTTCGATTAG TGCCGCTCTC GGTATGGCCA TTGCCGCTAA TGAGAAGGGG 
GAGAAGCGCA AAACAGTGGC CATTATCGGC GATGGCGGAA TGACGGCAGG AATGGCTTAT 
GAGGCGTTGG ATCATGCCGG TGCCCTGGGG GCTGATTTAC TTGTGATCCT GAATGATAAC 
GAGATGTCCA TTTCTCCTAA TGTGGGCGCA ATTTCTAGTT ATTTGACACG GTTATTAAGT 
GGGCGGGTTT ACTCAACGGT GCGGGAAGGT AGCAAAAAGG TGCTTGAACG TATGCCGCCA 
CCTATGTGGG AATTAGCGCG CCGCACGGAA GAACATGTGA AAGGGATGGT AGCTCCGGGG 
ACTTTGTTTG AAGAGATGGG CTTTAATTAT TTCGGCCCTA TCGATGGGCA TGATTTGAGT 
TCGTTGATTC GTACCTTACG GAATTTACAT AAGTTAACTG GCCCCCGTCT GTTGCATATC 
GTCACCTGTA AGGGTAAAGG TTATACGCTA GCGGAGGAAA ATCCGGTCAC CTATCATGGG 
GTAACCCCGT TTGATCCTAA GGTTGGCATC CAGCAAGGGC CCCAAAAACC ATCATCCGCA 
ATGAGCTACA CTCAAGTCTT CAGCCAGTGG TTGTGTGATA TGGCAGCCCA GGATGGACTC 
TTGGTAGGCA TTACTCCCGC TATGCGGGAG GGGTCGGGTC TGGTGAAATT TTCTGAATGT 
TTTCCGGAAC GTTACTTTGA TGTGGCTATT GCCGAGCAGC ACAGTGTGAC TTTAGCTGCC 
GGGATGGCAT GCGATGGGTT AAAACCGGTG GTTGCGATTT ACTCCACTTT TCTACAGCGG 
GCCTATGATC AGCTGATTCA TGATGTTGCT CTGCAAAACC TGCCAGTGCT TTTTGCCATA 
GATCGAGCTG GGGTGGTAGG GCCGGATGGC CCTACCCATG CGGGTAGCTT TGATTTGACC 
TATCTTCGCT GCATCCCTAA CCTGGTAGTG ATGGCTCCGG CAGATGAAAA TGAGTGCCGG 
CAGATGCTTT ATACGGGTTT CCTGCTTAAC CAACCGGCAG CAGTCCGTTA TCCTCGTGGG 
AAAGGACCAG GGGTAGCCGT TGAAGCAAGC ATGACAGCAC TGCCGCTGGG TAAGGCTGAG 
CTTAAGCGGA AAGGTCGGGG TATTGCTATC CTTGCTTTTG GTGCCACGGT GGCGCCCGCC 
CTTGAAGCAG CGGAAAAGCT GGATGCCACG GTGGTGAATA TGCGCTTTGT TAAACCCTTG 
GATGAAGATT TGGTCCTGGA AATGGCGATG AACCATGAAT TGCTGGTGAC TGTAGAGGAT 
AATGTTATTG CGGGCGGCGC GGGGAGCGCT GTCAGCGAAT GCTTGGCTTA TCATGGGGTT 
TCAGTGCCTT TACTCCTGCA TGGTTTACCT GATAATTTTT TAGAACATGG CTCCCGTGAG 
GCGCTCTTGG AGCAGTGTCA TTTGAATGCT GAGGGCATTC TCCAGCGCGT GAAAACCTAC 
CGTGCTCGGC TGCCTAAGTC CAAGGCTAGC GTGGTTTCCT CCGCAGCAGG TACCCATGGT 
TAA

Protein sequence

MASVTSYPLL EQIDSPERLR RLPESDLETL AEELRDFLLH SVARSGGHLA AGLGTIELTI 
ALHYIFATPE DRLVWDVGHQ AYPHKVLTGR RERLGTIRQA GGLAPFPSRH ESPYDTFGVG 
HSSTSISAAL GMAIAANEKG EKRKTVAIIG DGGMTAGMAY EALDHAGALG ADLLVILNDN 
EMSISPNVGA ISSYLTRLLS GRVYSTVREG SKKVLERMPP PMWELARRTE EHVKGMVAPG 
TLFEEMGFNY FGPIDGHDLS SLIRTLRNLH KLTGPRLLHI VTCKGKGYTL AEENPVTYHG 
VTPFDPKVGI QQGPQKPSSA MSYTQVFSQW LCDMAAQDGL LVGITPAMRE GSGLVKFSEC 
FPERYFDVAI AEQHSVTLAA GMACDGLKPV VAIYSTFLQR AYDQLIHDVA LQNLPVLFAI 
DRAGVVGPDG PTHAGSFDLT YLRCIPNLVV MAPADENECR QMLYTGFLLN QPAAVRYPRG 
KGPGVAVEAS MTALPLGKAE LKRKGRGIAI LAFGATVAPA LEAAEKLDAT VVNMRFVKPL 
DEDLVLEMAM NHELLVTVED NVIAGGAGSA VSECLAYHGV SVPLLLHGLP DNFLEHGSRE 
ALLEQCHLNA EGILQRVKTY RARLPKSKAS VVSSAAGTHG