Gene Noc_2057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2057
Symbol
ID	3705033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2366807
End bp	2367937
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	51%
IMG OID	637738532
Product	transaldolase
Protein accession	YP_344047
Protein GI	77165522
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0176] Transaldolase
TIGRFAM ID	[TIGR00876] transaldolase, mycobacterial type

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000591024
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCTG CAGAGAATAA AAATAGCTTA GTCCTGTTGC GTGAGCTAGG CCAATCGATT 
TGGCTCAATG GTATTGACCG TCAGAAACTT ACGGATGGTA CCTTAGAGCA TTTGATTGAA 
GCATACGGCC TTGCGGGTCT CAGTATTAGC CCTGCTACTT TCGGGAAAGC GATTACGCAA 
GATAACTGTT ATCAAGCTGT TATAGAAAAG GAAGCCAAGG CAGACTACTC GGCCAGTGAA 
ATCTATGAAC ATCTGATAGT GGAAGATGCC CGCCTAGCTG CTGATCATTT CCAATCGCTT 
TACCGTCAAA CCGAGGGACG GGATGGTTTT GTTAGTCTGG AAATTTCCCC TCTGCTCGCC 
CATGATACCG AGGCCACGGT GCAGGAGGCG AGACGTTTGT GGCAAGAGGT TGATCGGCTT 
AATATCATGC TTGCCATCCC CGCTACCAAA GCCGGGTTAC CCGCCATCGA ACAACTCATC 
AGCGACGGCA TTAATGTGAA TGTCACCCTT CTGTTTTCCG TAGGACGTTA TCTGGAAATG 
GCCCATGCTT ATAGAGGGGG GTTGGAGAAA CGTTTGGCAA GGGGGCAGCC GATTAACCGG 
GTGGCTTCGG TCGCTAGTTT TTTCCTGGGT CGGATTGATC TTAAGGTGGA TCGTCTTCTG 
GATGAAATCG CTAGGGAAAG TGATTCCTAC CGCACTGAAA TAGCCCGTGG GCTGCGGGGC 
AAAGCGGCTC TGGCCAGTGC GGGATTTGCC TATGAGCGCT TTGGAGAATT CTATGAGCAG 
TCCAGCTGGG AACAGCTTGC CGAACGAGAA GGCCGGAAAC AACGCTTGCT GTGGACTTCC 
ACCTCTACTA AGGATCCCTT TTACAGCGAT ACTAAATACG TGGACTCCCT TATCGGTCCA 
GAAACGGTGA ATGCCATGCC CATGGCCACC CTGGATGCCT ATCGGGAACA CGGGCAACCT 
GAAATCCGGA TATGGACGGC GGTTCATGAG GCTTCCGACA TCATGCACCA GCTAGCGGAA 
CTGAAAATTG ACCTGCGCAT TGTGGATGAA AATTTGGAGA AGGAAGGAAT AGCCCAGTTC 
ATTGAGCCTT ATAACCAGTT GCTAGCGACT TTGGAGCAAC GCCGGAATTA G

Protein sequence

MNPAENKNSL VLLRELGQSI WLNGIDRQKL TDGTLEHLIE AYGLAGLSIS PATFGKAITQ 
DNCYQAVIEK EAKADYSASE IYEHLIVEDA RLAADHFQSL YRQTEGRDGF VSLEISPLLA 
HDTEATVQEA RRLWQEVDRL NIMLAIPATK AGLPAIEQLI SDGINVNVTL LFSVGRYLEM 
AHAYRGGLEK RLARGQPINR VASVASFFLG RIDLKVDRLL DEIARESDSY RTEIARGLRG 
KAALASAGFA YERFGEFYEQ SSWEQLAERE GRKQRLLWTS TSTKDPFYSD TKYVDSLIGP 
ETVNAMPMAT LDAYREHGQP EIRIWTAVHE ASDIMHQLAE LKIDLRIVDE NLEKEGIAQF 
IEPYNQLLAT LEQRRN