Gene Nmar_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1087
Symbol
ID	5773912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	991041
End bp	992597
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	32%
IMG OID	641316729
Product	hypothetical protein
Protein accession	YP_001582421
Protein GI	161528595
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAATT TACTTGTTTT ACTTTTTGTT TTAGGTTTCA GTCTTGTTGG CTCTGCTGAA 
CTAGTATTTG GACATGGATT TGGAAGCGAA ACCTTGCCCC CTGCGTCCAT AGGTGATAGA 
GATGTCACTT TTTCAATATC TGTATCGCCT TCTATTTTTG ATCCTACTGT AAATGAACAC 
TTGATAACCA TGAATCTTTT TGATTCAAAA ACAGAGGCAG CAATTGAACA TGTGACATTT 
GAAGTAGAAT TTTTAAAAAA TGACCAACAA CTTTTCAAAG AAGTTTTTCA TGATGAAACT 
GGCACTCTGA AATTATCTGT AATATCTGAT GATTCTGATG AGATTTCCAT TCAAGGAACT 
CAAGAATCTG TTTTAGGAGG ATGGCTAGTA GATGAACAAC ATCCATTAAC ATTTACTGGA 
CCTGTTTTCA CTTCTGGAGG CCTTTATGAG TACAAAGTAA AAATTTTGTC TATCGATTCT 
GATTCAAATG TTTTGAAAAA ACCTATTGAA TTTGAAGGTG GCATAAGTAT TGCAGACCAC 
CAATATTTCA ATGTGGATGA TCATTTGAAA CAATCTCAAA AACTACATGT TGTTTCTTAT 
TTTGATCAAA TTCAAGATTT TAATTTTGAC TCAAACCAAC TAACTTTTAC CATTCCTTTT 
GATTGGAATC AAAATTTTCA AGAGATAAGT GTGATTCATC AAGAAGTACG AATTCCAAAT 
ACGTTTAGTG ATTTTCTTTC TACAAATTAT GATTCATATG TAAATGGACT TTTACTGCCT 
CACGACATTA CAACTATTGA TGATTATTCT TTTGATGATC GAACTGTACA CACTGTGATT 
ACTCGTGATT TGCTCAAGTT GTTAAAGAAT AATGTGCAAA CATCTGATGA AATAATTGAG 
TTTAAACTAC AACCAAATGA CAAAGTTGAT TTTCCATTAG ATTTTACAAC CTCTGATTAT 
CAAGTATTCT TGTATTGGGA ACCTGAAATT ATTCATGCAG GTGAGGATGT GACATTTTTC 
ATAGATTTTC AGCAAATCTT TTCAGACCAT CATAAACACC ATGTGGAATA TGATTTTTCA 
GTAATCCAAC AGGGTAAGAC CATTTATCAA AATCATTTCA AAGGTGATAT TGATTCTGAT 
TATTCAAATA TCCATCAAGT AAACTTTGAT TCAAAATATT CTGGCTCAGC AAATCTTGTT 
GTATCTAACA TTGATGGTGA TTCTGAATCA AAAGGAAATT TTATTATCGT AATTGAGCCT 
GGCATATCTG CAAATTCTGA GACAAACGAA ATTCCATCTT GGGTAAAAAG TAATGCTGGT 
TGGTGGGCAG ATGGGTCAAT TGATGATGAT TCTTTCATTC AAGGAATTCA GTTTTTAATT 
GATGAAAACA TTATTCAAAT TCCTCCTACT TTGACTGGTT CAAATTCTCA AACAAACGAA 
GTTCCTGTAT GGGTTAAAGT CAATGCTGGT TGGTGGGCTG ATGGCACAAT TGATGATGAT 
GCCTTTGTAC AAGGAATGCA ATTTTTGATA AAATCTGGAA TAATTTCTGT AAACTAA

Protein sequence

MKNLLVLLFV LGFSLVGSAE LVFGHGFGSE TLPPASIGDR DVTFSISVSP SIFDPTVNEH 
LITMNLFDSK TEAAIEHVTF EVEFLKNDQQ LFKEVFHDET GTLKLSVISD DSDEISIQGT 
QESVLGGWLV DEQHPLTFTG PVFTSGGLYE YKVKILSIDS DSNVLKKPIE FEGGISIADH 
QYFNVDDHLK QSQKLHVVSY FDQIQDFNFD SNQLTFTIPF DWNQNFQEIS VIHQEVRIPN 
TFSDFLSTNY DSYVNGLLLP HDITTIDDYS FDDRTVHTVI TRDLLKLLKN NVQTSDEIIE 
FKLQPNDKVD FPLDFTTSDY QVFLYWEPEI IHAGEDVTFF IDFQQIFSDH HKHHVEYDFS 
VIQQGKTIYQ NHFKGDIDSD YSNIHQVNFD SKYSGSANLV VSNIDGDSES KGNFIIVIEP 
GISANSETNE IPSWVKSNAG WWADGSIDDD SFIQGIQFLI DENIIQIPPT LTGSNSQTNE 
VPVWVKVNAG WWADGTIDDD AFVQGMQFLI KSGIISVN