Gene Nmar_1453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1453
Symbol
ID	5774094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1321778
End bp	1323226
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	39%
IMG OID	641317101
Product	hypothetical protein
Protein accession	YP_001582787
Protein GI	161528961
COG category	[S] Function unknown
COG ID	[COG1690] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGACA TTACTCCAAA GAAAATTGGT GAGAATCAAT ACCAAATTGA TGCTGATTCT 
AATTTAGGAA TGAAAGTTCC AGTAAAGATT TACGCAAATC AAGGATTACT TGACAAAATG 
CTTACAGATA GAACTATCAT GCAAGCAAGA AATGTCTCAT CTATTCCTGG AATCGTAGGA 
CACAGTGTAG TTTTACCTGA TGGACATGAA GGGTATGGTT TTCCAGTAGG TGGAGTTGCT 
GCTATGGATG CTGAAGAAGG AATGATCAGT CCTGGTGGTG TCGGTTATGA CATTAACTGT 
GGAGTGAGAT TGCTCCGCTC TAATCTAACT GAAGAAGTAG TTCGCTCAAA ACTAAAGGAC 
TTGGTAACTG ATTTGTTTAG TTCAATTCCT TCAGGAGTTG GCTCTAAAGG TGCAGTAAAA 
CTTAGTCACT CAGAACTAGA CGAGGTTCTA GTTAATGGTG TAAACTGGGC AATTGATCAT 
GGTTATGGTT CTACAAATGA TTCAGATGTT TGTGAAGAGA ATGGTCAGAT AAAAAATGCA 
GACCCTAACA AAGTTTCAGA TAAAGCAAGA AAGAGAGGAG CTCCACAACT TGGAAGTTTA 
GGCTCTGGAA ATCACTTTTT AGAAATTCAA AAGGTTGCAG AAGTTCATGA TGAAGAAGCA 
GCTGAAAAGA TGGGAATCAA AGAAGGAACA ATTACAGTTC TAGTTCATTG TGGTTCAAGA 
GGATTTGGTC ACCAAGTTTG TAGTGATTAT TTGAGAGTAT CAGAACAAGC AATGTCAAAG 
TATGACATCA CTCTACCAGA CAGAGAACTT GCATGTGTTC CAAATACTTC TGAAGAAGGA 
GAGTCTTACA GAAAAGCAAT GTTTGCAGCT TTAAACTTTG CATGGAGTAA CAGACAGATG 
ATCACTCATT GGACAAGAAA ATCTTTTGAA CGCGTATTCA ACCAATCTGA ATCTGATCTT 
GACATGAAAC TAGTGTACGA CGTTGCACAC AATATAGCTA AAGTTGAAAA ACACAAAGTA 
AACGGAGAAG AAAGAAAACT AGTTGTCCAC AGAAAAGGTG CAACTAGAGC ATTTCCTGCA 
AACAGAGATG AGGTTCCAAC AAAATATCGT CATTTGGGGC AACCCGTATT GGTTCCAGGT 
TCAATGGGTA CTGCAAGCTG GATACTTTTA GGACAACCAA ATTCTATGGA CTTGAGCTTT 
GGTTCTACTG CACATGGTGC AGGAAGAACA ATGTCACGTT CCAAAGCAAG ACGAAATTAC 
ACTGAAGATG ATGTTAAAAA ATCCCTAAAT GACAAGGGCA TATTTATCAA GGCATTAACC 
CGAGATGGAG TTGTGGAAGA GACACCTCAA GCCTACAAGG ACGTTAATTC TGTAGTTGAT 
GTATCTCACA ATCTAGGAAT TGCCACCAAA GTAGCAAAAT TGGTGCCTAT AGGTGTGATT 
AAAGGTTGA

Protein sequence

MGDITPKKIG ENQYQIDADS NLGMKVPVKI YANQGLLDKM LTDRTIMQAR NVSSIPGIVG 
HSVVLPDGHE GYGFPVGGVA AMDAEEGMIS PGGVGYDINC GVRLLRSNLT EEVVRSKLKD 
LVTDLFSSIP SGVGSKGAVK LSHSELDEVL VNGVNWAIDH GYGSTNDSDV CEENGQIKNA 
DPNKVSDKAR KRGAPQLGSL GSGNHFLEIQ KVAEVHDEEA AEKMGIKEGT ITVLVHCGSR 
GFGHQVCSDY LRVSEQAMSK YDITLPDREL ACVPNTSEEG ESYRKAMFAA LNFAWSNRQM 
ITHWTRKSFE RVFNQSESDL DMKLVYDVAH NIAKVEKHKV NGEERKLVVH RKGATRAFPA 
NRDEVPTKYR HLGQPVLVPG SMGTASWILL GQPNSMDLSF GSTAHGAGRT MSRSKARRNY 
TEDDVKKSLN DKGIFIKALT RDGVVEETPQ AYKDVNSVVD VSHNLGIATK VAKLVPIGVI 
KG