Gene Nmag_3790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3790
Symbol
ID	8826660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	+
Start bp	171323
End bp	172549
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	60%
IMG OID
Product	integrase family protein
Protein accession	YP_003481893
Protein GI	289583483
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGCG AACACTACAA CTGGTCGAAA CAGTCACTCG ACGAACTGCA GGAGTGCTGG 
CGGACCGACA TCGAGCCCGA ACTTCGACGA AACGGCGTCG ATCTCACAAC GCGGCCAACC 
TACCAGGACG TCACCGACGC CGGCTTCTCG GGAATCGCCT ACGCACTTCG CGAACACCAC 
GAACTGACGC TCTCGGAATT TCTGGCGACC GTCGGCTACG AGGACAGAGA CACCGGTGCG 
TCGTTTCAAT GGGGGATCGA GGACGAATCC ACGATCACCG AACTCGAGTC CTACCTGCGA 
ACGCTCGAGC GTCGCCGCCA ACTCGCCGAG ACGACGGTAC GGACGAAACA GTCTCGACTG 
GCGACCTACA CCCGGTTGTA CCGTGAGCTC CACGGGAAAG CGAATCTCGT CGAACGCGTC 
GCTGACTCGG ATGCGGAGAG CGAGGAAATC CGCCGCGCAC TCGCGGTGTT CGACGAACTG 
AACGCCGACC TCGGGACTGA CGCCTCGAAG CTACGCTATC ACAGCGACGT CTCTCAGTTC 
TACGAGCACC TCGAACGACG GGCGAAAGCC TCGTTCAACC CCGTCGAATC GATCGATGAG 
GAGTACAACT GGTCTCGAGC CGATCCAGAC AACGCGGCCC TCTCACCCGA ACAGGTCCGG 
ACAATCTACG CCGCTGCGGA CGCTCCGTCC GACGAACTGC TCGTTCTGGC ACTCTGTGCG 
TGGGGACTGC GCCGAAACGA GGTTGCGAGC CTGCACGTCT CCCAGCTTGA ACTCGAGTCC 
GACGAGCCAC ACATCGTGTT CGAGGAGCGA AAGAACGGGC CGGGAACGGT CGCGTTGATC 
TATGGCGTGC CGGAACTGTC TAATCGGGTC GACGAGTTGG GTGCAGGCAA TCGCAACTGG 
TCGGGATATC TGTTCCCGTC GCCGAACGCG AACCGTGATC ATGTTACCGG CGAGACCGTT 
CAGGCACGGT TTCAGCGCCT TGCAGACCAG GCTGACGTGC GCGTTCGGGG CGAACGTCCG 
ACGTCAAAAA TGGGCCGGCG CTTCTGGTAT ACGACGTACA ACGAGGCGAT GAGCGACTTA 
CTCGAGAACC TGGACACAAT CGCGGCCGAT CAGGGCAGTG CTGATGCGTC TGTCGTGTTG 
AAGAACTATC TGTCTGAGGC TGAACGGCGG GAATATCGTC GTGATTTCAT GCGTGAACGG 
CTCGCAGCGG TGTTTGGGGC CGAGTGA

Protein sequence

MSSEHYNWSK QSLDELQECW RTDIEPELRR NGVDLTTRPT YQDVTDAGFS GIAYALREHH 
ELTLSEFLAT VGYEDRDTGA SFQWGIEDES TITELESYLR TLERRRQLAE TTVRTKQSRL 
ATYTRLYREL HGKANLVERV ADSDAESEEI RRALAVFDEL NADLGTDASK LRYHSDVSQF 
YEHLERRAKA SFNPVESIDE EYNWSRADPD NAALSPEQVR TIYAAADAPS DELLVLALCA 
WGLRRNEVAS LHVSQLELES DEPHIVFEER KNGPGTVALI YGVPELSNRV DELGAGNRNW 
SGYLFPSPNA NRDHVTGETV QARFQRLADQ ADVRVRGERP TSKMGRRFWY TTYNEAMSDL 
LENLDTIAAD QGSADASVVL KNYLSEAERR EYRRDFMRER LAAVFGAE