Gene Noc_2145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2145
Symbol
ID	3705337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2477708
End bp	2478979
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	53%
IMG OID	637738621
Product	L-sorbosone dehydrogenase
Protein accession	YP_344135
Protein GI	77165610
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAC CACGCAATAA CGCCCTGGCT TGGGGCGTAT GGATACTATT CTTTTGGTTC 
TCTTTCTCTT CTATCACTCT GGCGCAACAG GTTTGCGACT CAGAAAATGA AGGGCTTACT 
CTGCCTAAGG GTTTTTGTGT CCTTATGGTG GCGGATAAAG TAGGGAAGGC CCGCCATTTG 
ACAGTGGCCC CCAATGGCGA TGTCTTCGTC GCTATTGGCG CAACCAAGGC ATCGCCAGGG 
GGTGTGTTGG CGCTACGAGA TACCACAGGC GACGGTGTTG CCGATTTAAA AAAGCGTTTT 
GGCAGTGGTC CTGGCGATGA TGTGGAATTT TATGATGGTT ACCTTTATTT CGCGACTCAC 
GAAAAAATCG TGCGCTATCC TTGGCGTAGT GGAGATTTAG AACCGGCGGG GCCCGCCGAG 
ACTATCGTTG AAAAGCTCCC TGCCGCTGCT AGCCATCGAG CTAAAAGTAT CGCTTTTAGT 
CCTGAAGGCA AGCTTTATGT CAATATCGGT TCGCCCTCCA ACGCCTGCCA GAAACAGGAC 
CGCACCGCCG GCTCACCGGG AAAGGAGCCT TGCGATGAAC TTGTTACCCG TGCTGGAATC 
TGGCGTTTTG AGGCCGGCCA ACCCAACCAA GCCCAGCAAG ATGGTAGCCG TTTTGCCACA 
GGGCTTCGTA ATACGGTCGC TTTAGCTTTA CGCCCCCAGG ATGGCCAGTT GTACGGCGTC 
ATTCATGGCC GCGATCAGCT AAGTTTGTGG CCTCACTTCA ATGATAGCCA GAATGCAGAA 
AAACCCTCGG AGGAGTTGGT GCGCATCCAG GAAAATAACG ATTTTGGTTG GCCCTACTGC 
TATCATGATC CCGCCCTTAA CCAGAAAGTT CTGGCCCCCG AGTATGGCGG AGATGGAAAA 
ACCGTGGATC GCTGCCAGAA AAAACAAGAT CCGCTGCTGG CCTTGCCCGC CCATTGGGCA 
CCTAATGGGC TCCTCTTTTA TTCTGGCGAA CAGTTCCCAG AACGGTATCG GGGCGGGGCT 
TTTATTGCCT TCCATGGTTC CTGGAACCGG GCGCCATTGC CCCAGGGGGG TTATAAGGTT 
GTTTTTGTTC CTTTCAAGGG AAAGGAACCC ACGGGCGAAT GGGAGGTATT TGCCGAGGGT 
TTTGCCGGTC AACATAAGAC TCCCCGCGCT GCCGAGCATC GACCAGTGGG TGTTGCCGAA 
GGTCCGGAGG GCTCCCTTTA TATTAGTGAT GATCAGGGAG GTCGTATCTA TCGTGTTTTC 
TATAGGCCAT AG

Protein sequence

MAKPRNNALA WGVWILFFWF SFSSITLAQQ VCDSENEGLT LPKGFCVLMV ADKVGKARHL 
TVAPNGDVFV AIGATKASPG GVLALRDTTG DGVADLKKRF GSGPGDDVEF YDGYLYFATH 
EKIVRYPWRS GDLEPAGPAE TIVEKLPAAA SHRAKSIAFS PEGKLYVNIG SPSNACQKQD 
RTAGSPGKEP CDELVTRAGI WRFEAGQPNQ AQQDGSRFAT GLRNTVALAL RPQDGQLYGV 
IHGRDQLSLW PHFNDSQNAE KPSEELVRIQ ENNDFGWPYC YHDPALNQKV LAPEYGGDGK 
TVDRCQKKQD PLLALPAHWA PNGLLFYSGE QFPERYRGGA FIAFHGSWNR APLPQGGYKV 
VFVPFKGKEP TGEWEVFAEG FAGQHKTPRA AEHRPVGVAE GPEGSLYISD DQGGRIYRVF 
YRP