Gene Nmar_1078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1078
Symbol
ID	5773246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	982395
End bp	983390
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	36%
IMG OID	641316720
Product	fructose-bisphosphate aldolase
Protein accession	YP_001582412
Protein GI	161528586
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1830] DhnA-type fructose-1,6-bisphosphate aldolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTGGG GATTAAAAAA CAGATTATCT AGTATAATTA AACCACACAA TAACCGCGCA 
CTTATGTTAG CAGTTGATCA TGGATATTTT CTTGGACCAA CTGAGAGATT AGAGAATCCA 
AAAAAGGTCA TTGCACCTCT ATTGAAACAC TGTGATTCTT TGATGTTAAC TAGAGGTGTT 
CAGAGAACAT CTGTTCCTGC AGAAACTGAT ACTCCTATGG TACTTCGTGT ATCTGGTGGT 
TCTAGTATTA TTGGTGATGA CTTGTCTCAA GAAGACATTA CAGTATCAAT CCAAGATGCC 
ATTAGACTAA ATGCTAGTGC CCTTGCAATG TCTATCTTTG TAGGCTCAAA ATATGAATAT 
CAAACAGTTG TTAATCTCGG AAAACTAGTC AGCGAAGCAG AGCAATATGG CATTCCGGTT 
TTGGCCGTAA CTGCAGTTGG CAAAGAATTG GGCAAAGATG CAAGATATCT CTCTCTAGCT 
TGTAGAATGG CTGCAGAACA AGGCGCACAT ATTGTAAAAA CATACTATTG TGATAATTTT 
GAAAAAGTTG TTGAATCTTG TCCTGTACCA ATTATTGTTG CAGGAGGAAA GAAAATCCCA 
GAACGTGATG CATTACAATT AACTTACAAT GCTGTCAAGG CAGGTGCTGT TGGTGTTGAT 
ATGGGACGAA ACATCTGGCA ATCTGATCAT CCAGTTGCCA TGATTAGAGC AACAAGAGCA 
ATTATTCATC AAAATGCAAA TGTTGATCAA GCTTTCAAAC TATACAAAAA ACTTGCAAAC 
GAAGATTCAA ACAAGAAACA AAAATCAAAA GGCAAAAAGC CAAACCAAAA CAAATCAAAA 
GGAAAGAATC CTAATCAAAA CAAAACCAAA GGCAAAAAGC CAAACCAAAA CAAATCAAAA 
GGAAAGAATC CTAATCAAAA CAAAACCAAA GGCAAAAAGC CAAACCAAAA CAAGTCAAAC 
AAACCCCAAA ACAAACCTCA ACCAAAAAAG AATTAA

Protein sequence

MDWGLKNRLS SIIKPHNNRA LMLAVDHGYF LGPTERLENP KKVIAPLLKH CDSLMLTRGV 
QRTSVPAETD TPMVLRVSGG SSIIGDDLSQ EDITVSIQDA IRLNASALAM SIFVGSKYEY 
QTVVNLGKLV SEAEQYGIPV LAVTAVGKEL GKDARYLSLA CRMAAEQGAH IVKTYYCDNF 
EKVVESCPVP IIVAGGKKIP ERDALQLTYN AVKAGAVGVD MGRNIWQSDH PVAMIRATRA 
IIHQNANVDQ AFKLYKKLAN EDSNKKQKSK GKKPNQNKSK GKNPNQNKTK GKKPNQNKSK 
GKNPNQNKTK GKKPNQNKSN KPQNKPQPKK N