Gene Nmar_1198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1198
Symbol
ID	5773259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1092421
End bp	1093617
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	30%
IMG OID	641316842
Product	tRNA pseudouridine synthase TruD
Protein accession	YP_001582532
Protein GI	161528706
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATACCTG ATTTAGATTC TAAAATAGGA ATTTCTGTTT ATAGTACAAA ATTTGACGGA 
ATTGGGGGAA AAATTCGTAC TACTCCTGAA GACTTTGAAG TCTCTGAAAA AATTTTAGAA 
AAAACTCTGA ATTCAATTAA TCAAGAAGAA GGATATGCTG TTTACAAATT AAAAAAGAAA 
AGAATTGATA CAAATCATGC ACTATCTGAT ATTTTTAGAA AGAAAGGTCT TAGACTAAAG 
TCTCTTGGAT TAAAGGATGC ATCTGCAATC ACTGAACAGT TTGTTTGTTC TGGAAATAAA 
GGTAAATCAA TTGAAGATTA TTCAACTGAA AAATATTCTT TGAAAAAAAT TGGCTTTGTA 
AAAAAACCTC TTTCAAAAAA AGATATGATT GGGAATCATT TTAAAATCAA AATCTCTGAT 
TGTACCAATA AACTATCTTC ATTTGAAGAG TTTAACAATG TCTTGAATTT CTATGGGTAT 
CAAAGATTTG GCTCAAAGAG GCCTGTAACT CATTTGATAG GTAAAGCAAT ACTTCAAAGA 
GATTTTGATA AAGCAGTTGA ACTTGTTTTG TCTTTTACTT CTGATTATGA TTCAAAAGAA 
AATAATGAAA TTCGACAAAA ACTTGTTGAT AAACAAAACT ACAATCAATA TTTTGAGAAA 
ATACCAAAAC AAATGGATAT TGAAAGAATT GTCCTAAAAG AAATGATTGA ACATGATGAT 
GCATTTCGTG CAATACGTGC AATTCCCGTA TCTTTGAGAA GATTTTACAT TCAGGCATAC 
CAGTCGTTTA TTTTCAATAA ATCTCTGAGT ACTGCATTTA CTGATGGTGA AAATATGTTT 
GAATCTGAAT CTGGTGATGT TTGTTTTGAT TTTAATGGAA TCATTGGAAA ATTTGTAAAG 
GGATTAGATC AAAAATTGGC TATACCTTTT GTTGGATATT CATATTACAA AAAAACAAGA 
TTTGATTATC ATATATCACA AATAATGCAG CAAGAAGAAA TAACTCCCAA AGACTTCTTT 
ATCAAAGAGA TGCAAGAAGT AAGCAGTGAG GGAGGATTTC GACAAGCTGC AATAGATTGT 
TCTGATTACT CGTCTCGTGA TGATGTTGTA GAATTTACTT TGTCAAGGGG ATCTTTTGCA 
ACAATTTTGT TGAGAGAGAT TATGAAACCA TCTGATCCTA TTTATGCTGG TTTTTGA

Protein sequence

MIPDLDSKIG ISVYSTKFDG IGGKIRTTPE DFEVSEKILE KTLNSINQEE GYAVYKLKKK 
RIDTNHALSD IFRKKGLRLK SLGLKDASAI TEQFVCSGNK GKSIEDYSTE KYSLKKIGFV 
KKPLSKKDMI GNHFKIKISD CTNKLSSFEE FNNVLNFYGY QRFGSKRPVT HLIGKAILQR 
DFDKAVELVL SFTSDYDSKE NNEIRQKLVD KQNYNQYFEK IPKQMDIERI VLKEMIEHDD 
AFRAIRAIPV SLRRFYIQAY QSFIFNKSLS TAFTDGENMF ESESGDVCFD FNGIIGKFVK 
GLDQKLAIPF VGYSYYKKTR FDYHISQIMQ QEEITPKDFF IKEMQEVSSE GGFRQAAIDC 
SDYSSRDDVV EFTLSRGSFA TILLREIMKP SDPIYAGF