Gene Nmar_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1035
Symbol
ID	5773297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	909195
End bp	910340
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	38%
IMG OID	641316677
Product	hypothetical protein
Protein accession	YP_001582369
Protein GI	161528543
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1980] Archaeal fructose 1,6-bisphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAATA TGAAAATTAC AGTTTCAGTT ATCAAAGCCG ATGTCGGCGG TGTCGGAGGA 
CATACAAAAC CTAGTGACGG ATTATTAGAC GCAATTAGAA ATACCGTTAA AAATTCAGCA 
GATTTGCTTA TCGATTATTA CATTGGATAT TGTGGTGATG ACACCCATAT CGTAATGTCT 
CACACTCATG GTGTAGACAA TCAACAAATT CACAAACTAG CATGGGATGC ATTCATGGCA 
GGAACTCAAG TTGCAAAAGA AGAGGGATTG TATGGTGCAG GACAAGACTT GCTCAAAGAC 
TCTTTCTCTG GAAACGTAAA AGGAATGGGT CCAGGAGTTG CAGAAATGGA ATTTGAAGAA 
AGACCAAATG AAGCATTTAC AGTATTTGCA GCTGACAAAA CAGAACCAGG TGCATTCAAC 
TATCCAATTT ACAGAATGTT TGTAGATGCA CTAAGTAACA CAGGATTAAT TGTAAACAAG 
AATCTTGCAG ACGGGGTTAA AATTAATATC ATGGATGTTG AAAAGGCTCA GATTGCAGAG 
TTGCAATTAT GGGAAGATAA ACCAACAATT GAAGCAGCAT TAATGTATCC AGGTAGATAC 
GTTGTAGATT CAGTTACAAC AAAAGATGGA GAACCAATTC TTGCCGCATC AACTGATAGA 
TTACACAATA TTGCAGGAAC ATATGTTGGA AAAGACGATC CAATTTGTGT TGTCAGAACA 
CAAAAGAAAT TCCCTGCAAC TGAAGAAGTA GGAAGTGTGT TTAACAATCC ACATTTTGTT 
GCAGGAAACA CAAGAGGAAG TCATAATATG CCATTAATGC CTGTAAAACT AAACTCTGCA 
GCTACAATCA ACTTTTGTAT TCCAATCGTT GAGGCACTTG TATTTAGTAT GCATAACGGA 
AAGTTTACAG GACCATTTGA TGGATTCTCA ACTCCAGATT GGGATCTAAT CAGAGAGAGA 
GCAACAGAGA AAGCCATGGC AATTAGAAGC CAAGGATTTA TCCATCCAGC AACACTTGTA 
CCATCAGAAC TAGAATATGC TGAAGGTTAT AGAGCTAGAA TGGATGTTCT TGAAAGTAAG 
ATGAAACCAA TGGAAGGAAC TGATTCTAGC GGTGACAGAA AAGAGAATTA CGAAGATCCA 
GATTAG

Protein sequence

MENMKITVSV IKADVGGVGG HTKPSDGLLD AIRNTVKNSA DLLIDYYIGY CGDDTHIVMS 
HTHGVDNQQI HKLAWDAFMA GTQVAKEEGL YGAGQDLLKD SFSGNVKGMG PGVAEMEFEE 
RPNEAFTVFA ADKTEPGAFN YPIYRMFVDA LSNTGLIVNK NLADGVKINI MDVEKAQIAE 
LQLWEDKPTI EAALMYPGRY VVDSVTTKDG EPILAASTDR LHNIAGTYVG KDDPICVVRT 
QKKFPATEEV GSVFNNPHFV AGNTRGSHNM PLMPVKLNSA ATINFCIPIV EALVFSMHNG 
KFTGPFDGFS TPDWDLIRER ATEKAMAIRS QGFIHPATLV PSELEYAEGY RARMDVLESK 
MKPMEGTDSS GDRKENYEDP D