Gene Noc_2788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2788
Symbol
ID	3705518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3163140
End bp	3164132
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	51%
IMG OID	637739264
Product	sugar phosphate isomerase
Protein accession	YP_344765
Protein GI	77166240
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG0517] FOG: CBS domain [COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000495576
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGTTG CATACAATGA TGATATGGAT AAGCGGCTTA TTCAACTAGG AGCGGCTGTT 
ATCGACACTG AGGCCCATGC GATAGCAGCG CTACGAACGC GAATCAATGG GAACTTTGCT 
GCCGCCTGTA AATACATGCT GGCATGCGAA GGCCGTATCG TTATATTAGG GATGGGTAAA 
TCAGGCCATA TTGGCGGCAA AATTGCCGCT ACTCTTGCCA GTACGGGTAC GCCAGCTTTT 
TTCGTCCACC CTGGTGAGGC CAGCCACGGG GATCTGGGTA TGATTACCGA AAAGGATGTG 
GTACTAGCAC TGTCAAATTC TGGAGAGACG GAAGAAATCT GTACGATTCT CCCTCTCATC 
AAACGCTTAG GCGTTCCACT GATTGCCTTA ACTGGCCAGC CCCGGTCAAC TCTAGGAAAG 
GTTGCTGACA TCCACATCGA TATTAGCGTC GAAAAAGAAG CCTGCCCTCT CGGACTAGCG 
CCGACGGCCA GCAGCACAGC AACTTTAGCC ATGGGCGATG CCCTGGCCAT TGCCTTGCTG 
GAAAGCCGGG GGTTCACTGC AGAGGATTTT GCTCGTTCCC ATCCGGGCGG TCGTCTGGGG 
CGCCGCCTCT TACTTCGCAT TAGCGATATC ATGCATAAAG GCGAGGAAAT TCCGGCTATC 
CCAGAAAATG TGCTATTGAG CAGCGCTTTG CTAGAAATGA CTCGCAAAGG GTTAGGAATG 
ACGGCTGTGG TCAATGCTCA AAACCACGCC GTAGGAATCT TTACCGATGG CGATTTGCGT 
CGCGCTCTTG ATCAGGGAAT CGATGTCCAT ATTACCCCAA TTGCCAAAAT CATGACCGCC 
AATTGTAAAA CCCTAGGTCC GGATCTGCTC GCCGCTGAAG CGTTGCAAAT AATGCAGCGT 
CATCGTATTA ATGCACTCCT CGTAGTAGAC ACTGAGCAAC GCTTAATTGG CGCCCTCAAT 
ATGCATGATT TGCTTCGAGC CGGTGTCTTG TAA

Protein sequence

MPVAYNDDMD KRLIQLGAAV IDTEAHAIAA LRTRINGNFA AACKYMLACE GRIVILGMGK 
SGHIGGKIAA TLASTGTPAF FVHPGEASHG DLGMITEKDV VLALSNSGET EEICTILPLI 
KRLGVPLIAL TGQPRSTLGK VADIHIDISV EKEACPLGLA PTASSTATLA MGDALAIALL 
ESRGFTAEDF ARSHPGGRLG RRLLLRISDI MHKGEEIPAI PENVLLSSAL LEMTRKGLGM 
TAVVNAQNHA VGIFTDGDLR RALDQGIDVH ITPIAKIMTA NCKTLGPDLL AAEALQIMQR 
HRINALLVVD TEQRLIGALN MHDLLRAGVL