Gene Nmar_0603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0603
Symbol
ID	5774118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	537875
End bp	539041
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	32%
IMG OID	641316238
Product	hypothetical protein
Protein accession	YP_001581937
Protein GI	161528111
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCAT TCTTGCTAAA GAAAAAACGC CTAAAAACAT GGGATGAAAA ACTATCCAAC 
AAATCCCAGA GGACAAAAGA TGGTTATACT TTAGTTATCA AATCCTTTGA AAAATTCTGC 
AGCGAGTATT ATGGAGGTAG AACAAAAGAC GATATCTTTG ATGAATTATC TGTTCTAAAA 
GATGCTGAAA AGACTCTTGC TACTGTAGAT TTGATTCAAA ATTGGATTAA TTGGCATTAT 
TCTCATGGTG TAAAAACATC CGTTGTAAAG TTGTATCTTG CATGGCTAGG AAAATACTTT 
GATTATAGAG AGATTTCAAT AACTCAAAAG ATAAAGGATG AACTTGACTT TAAACGCGAT 
CTAAAAGACG AACCCTTTGC ACTTGAAATT CAACATATTC AGAATATTTT CAAATTTGCT 
AGTCCTAAAA AGATTGGATT CTATCTCGCA CTAGTCTCTA CTGGCGCAAG ACCTGCTGAA 
CTATTACAGG TAAAAAAGCG TGACATTATC ACATCTACAA AAAGACTCAA GGTATTGATT 
CAACCTGAAG GTGTAAAGAC TCGACATGGA CGTTCAGCAT ATCTTACAAA AGAAGCTGCA 
CGATACTGTT TGATGAGATT ACGTCAAATT AGTGATGATG ATCTAGTCTG GGGTAAACAT 
GAAGATTATA GCAAAACAGA AAAAGCAGAA TCAAAGACAT TTTCAAGATA TTGTGATAAT 
GCAGGCTATG TTGAACGATA TCATTCTAAT AATTATAGAA AAATCACCCT CTATTCTTTT 
AGGTCCTTTT TCTTTAGTGC TGCAGCAGAC GTAAATCGTG AAGGATATGC ACACAAAATG 
ACTGGTCATG GGGGATATCT GTCTCAATAT GACCGAATGT CTGATGAAAA GAAACTTGAA 
TGGTTTTTGA AAGTAGAGCC ATTTTTGACT ATAGATGATG ATGAAAGATT ACAACTTGAA 
AATAAACAAC TAAAGAAGGA AAATACAGAG AAAAAACAAT TCGAAGAAGA AATCAAAAAT 
TTAAAGAAAA GACAAGTAGA GCTTGAATAT AATCAAAAAG AATACGAATC AATCAAACCT 
GATGTAGAGA AACTTGTTTT AAATTATTTT GAAGAACTTG GAGAAGATTT TTTCAGAAAA 
GTATTTTCAA AAAATAGCAT AAATTAA

Protein sequence

MSSFLLKKKR LKTWDEKLSN KSQRTKDGYT LVIKSFEKFC SEYYGGRTKD DIFDELSVLK 
DAEKTLATVD LIQNWINWHY SHGVKTSVVK LYLAWLGKYF DYREISITQK IKDELDFKRD 
LKDEPFALEI QHIQNIFKFA SPKKIGFYLA LVSTGARPAE LLQVKKRDII TSTKRLKVLI 
QPEGVKTRHG RSAYLTKEAA RYCLMRLRQI SDDDLVWGKH EDYSKTEKAE SKTFSRYCDN 
AGYVERYHSN NYRKITLYSF RSFFFSAAAD VNREGYAHKM TGHGGYLSQY DRMSDEKKLE 
WFLKVEPFLT IDDDERLQLE NKQLKKENTE KKQFEEEIKN LKKRQVELEY NQKEYESIKP 
DVEKLVLNYF EELGEDFFRK VFSKNSIN