Gene Nmag_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1744
Symbol
ID	8824584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	1777528
End bp	1780740
Gene Length	3213 bp
Protein Length	1070 aa
Translation table	11
GC content	64%
IMG OID
Product	isoleucyl-tRNA synthetase
Protein accession	YP_003479880
Protein GI	289581414
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGGT TTAGCGAGGT CGACGACCAG TACGACCCCG ATGCCGTCGA GCAACGGGTG 
TTCGACTACT GGGACGACGT CGATGCCTAC GAGCAAACTG TCGAGCACCG ATCGGACGGT 
GAATCGTTCT TCTTCGTCGA CGGCCCGCCG TACACGTCGG GCTCGGCACA CATGGGGACC 
ACCTGGAACA AGTCCCTCAA GGACGTCTAC ATCCGCTTCC ACCGGATGCA GGGCTACGAC 
GTCACCGACC GGCCGGGCTA CGACATGCAC GGGCTCCCGA TCGAAACCCG CGTCGAGGGC 
CAACTCGGCT TCGAGAACAA GAAGGACATC GAGGAGTACG GCGAGGAGAA CTTCATCGAG 
GCCTGCAAGG AGTACGCAGA CGAGCAACTC GAGGGCCTCC AGTCTGACTT CCAGGACTTC 
GGCGTCTGGA TGGACTGGGA GAACCCGTAT CGGACGGTTA GCCCCGAGTA CATGGAGGCA 
GCCTGGTGGG GCTTCTCGAA GGCTGCAGAG CGCGGCTTAG TCGAGAAAGG CCACCGCTCG 
ATTTCACAGT GTCCGCGCTG TGAGACGGCA ATCGCGAACA ACGAGGTCGA GTACGAGGAC 
GTCGAGGACC CCTCGATCTA CGTGAAGTTC GACCTCGCCG ACCGCGAGGG CTCGATCGTC 
ATCTGGACGA CGACGCCGTG GACTATCCCG GCGAACACCT TCGTCGCAGT CGACGAGGAG 
GGCGACTACG TCGGCGTCCG CGCCGAGAAG GACGGCGAGG AGGAACTGCT GTACGTCGCC 
GAGGCCAAAC ACGAGGACGT GCTGAAGACG GGCCGCTACG ACGACTACGA GGTCGTCGAG 
GAGGTCGCCG GCGAAGAGAT GATCGGCTGG GCGTACGAGC ACCCACTCGC CGAGGAAGTG 
CCAGACACCG TCGACGCAGA GGGAACCCAC GAGGTCTACG CTGCCGACTA CGTGGACACG 
GGCGGCGACG GCACCGGTCT CGTCCACTCC GCACCGGGTC ACGGTGAGGA GGACTTCGAG 
CGCGGAACGG AGCTTGGCTT CCCGATCTTC TGTCCCGTCG ATGGCGACGG CGTCTACACC 
GAGGAGGCCG GCAAGTACGA AGGCGAGTTC GTCAAGGACG CAGACCCAGA GATCACGGCC 
GATCTCGAGG ACAACGGCGC GCTGCTCGCC TCCGAGACGG TTTCCCACAG CTACGGTCAC 
TGCTGGCGGT GTGATACGGG CATCATCCAG ATCGTTACCG ACCAGTGGTT CATCACGATC 
ACGGACGTGA AAGACGAGCT CCTCGAGAAC ATCGAGGACA GCCAGTGGCA CCCAGACTGG 
GCGCGAGACA ACCGCTTCCG CGACTTCGTC GAGGAGGCAC CCGACTGGAA CGTCTCCCGA 
CAGCGCTACT GGGGTATTCC GCTGCCCGTC TGGACGCCAG AGGACCGTGA TGATGATGAA 
GACATGATCG TCATCGGCGA GCGCGAGGAA CTCGTCGACC GCGTCGATCA GGATATCGAC 
GTCGATACGG TCGACCTGCA CAAGGACACC GTCGACGACC TCACGATCAC CGAGGACGGC 
ACCACCTACA CTCGCGTGCC CGACGTGTTC GACGTCTGGC TCGACTCTTC GGTCGCCTCC 
TGGGGAACCC TGAACTACCC CTCGGACGAC AGCCAGTTCG ACGACCTCTG GCCCGCAGAC 
TTCATCCTCG AAGCCCACGA CCAGACCCGC GGCTGGTTCT GGTCCCAGCT CGGCATGGGC 
ACCGCCGCAC TCGGCGACAT TCCCTATGAA GAGGTCCTCA TGCACGGCCA CGCGCTCATG 
CCCGACGGCC GCGCAATGTC CAAGTCCAAG GACATTCTGG TCGACCCCCA CGAGGCCATC 
GACCGCCACG GCCGGGACGT GATGCGTGCG TTCTTGCTGT CGAACAACCC GCAGGGCGAC 
GACATGCGCT TCTCCTGGGA GGGCATGCAG ACGATGGAGA ACCACCTCCG GACGCTGTGG 
AACGTCTTCC GGTTCCCGCT GCCGTACATG CGGCTCGATG AGTTTGATCC GCAGGCGACG 
ACCGTCGAAG ACGTGCAAGC GGATCTCGAA CTCATCGACG AGTGGGTGCT CGCCCGCCTG 
CAGTCCACCA AGGACGAGAT GACCGCCCAC TTCGACGAGC GCCGCCAGGA CAAGGCCCTC 
AACGCGCTCA TCGACTTCGT CGTCGAGGAC GTCTCACGGT TCTACGTCCA GGCCGTCCGC 
GAGCGTATGT GGGAAGAAGA GGACAGCGCC TCCAAGGAAG CCGCCTACGC GACCATCTAC 
CGTGTGCTCC GCGAAACCGT CGCGCTGCTC GCTCCCTACG CGCCGTTCAT CAGTGAGGAA 
ATCTACGGCA CGCTCACCGG CGACGCCGAA CACGACACCG TCCATATGTG CGACTGGCCC 
ACCGTCGACG AGACGTTCGT CGACGAGCAA CTCGAGGAGG ACGTCGCATT CCTTCGCGCC 
ATCGAAGAAG CCGGCGCGAA CGCTCGTCAG CAGGCCGGCC GCAAACTGCG CTGGCCCGTC 
CCACGCGTCG TCGTCGCAGC CGACGACCAG CGCGTCGTCG ATGCTGTCGA GCGCCACACC 
CCACTGCTCG AGGATCGCCT CAACGCCCGC GAGATCGAAC TCGTCTCGCC GGACGACCGC 
TGGGGCGAAC TGAACTACAG TGCCGAAGCA GACATGAGCG AACTCGGACC GACGTTCGGC 
GACCGCGCCG GCCAGGTCAT GAACGCGCTC AACGAGGCCC GGATCGACGA GCCGACACTC 
GAGTCGATCG CAGCGGCTGT GGAGGATGTA CTCGAGTCCG GCGAGGAGAT CACCGAGGAG 
ATGGTCTCGT TCGTCACCCA GACGCCGGAG GGTGTCGCCG GCACGGCCTT TGGGCTGAAC 
GGCGACGACC GCGGGGTTGC GTACGTCGAC GCCTCGCTCA CTGACGATAT CGAGAGCGAG 
GGGTACGCCC GCGAGGTTAT CCGCCGGGTA CAGGAGATGC GCAAGGACCT CGACTTAGAT 
GTCGAGGAGC GAATTGCGCT GGAGCTCGAA ATCGAAGACG ACCGCGTTGC CTCGCTGGTC 
GACGAGCGTG CGGATCTGAT CCGCGAGGAG GTTCGTGCGG ATGAGTTCGG CGGCGACGTT 
GTCGACGATG GTCACCGCAA GGAGTGGGAG GTTGAAGGCG TGGCGATGGA GATCGCGATC 
GAGTCGTTGG CAGCGCCGGA AGCGTCTGAA TAA

Protein sequence

MSRFSEVDDQ YDPDAVEQRV FDYWDDVDAY EQTVEHRSDG ESFFFVDGPP YTSGSAHMGT 
TWNKSLKDVY IRFHRMQGYD VTDRPGYDMH GLPIETRVEG QLGFENKKDI EEYGEENFIE 
ACKEYADEQL EGLQSDFQDF GVWMDWENPY RTVSPEYMEA AWWGFSKAAE RGLVEKGHRS 
ISQCPRCETA IANNEVEYED VEDPSIYVKF DLADREGSIV IWTTTPWTIP ANTFVAVDEE 
GDYVGVRAEK DGEEELLYVA EAKHEDVLKT GRYDDYEVVE EVAGEEMIGW AYEHPLAEEV 
PDTVDAEGTH EVYAADYVDT GGDGTGLVHS APGHGEEDFE RGTELGFPIF CPVDGDGVYT 
EEAGKYEGEF VKDADPEITA DLEDNGALLA SETVSHSYGH CWRCDTGIIQ IVTDQWFITI 
TDVKDELLEN IEDSQWHPDW ARDNRFRDFV EEAPDWNVSR QRYWGIPLPV WTPEDRDDDE 
DMIVIGEREE LVDRVDQDID VDTVDLHKDT VDDLTITEDG TTYTRVPDVF DVWLDSSVAS 
WGTLNYPSDD SQFDDLWPAD FILEAHDQTR GWFWSQLGMG TAALGDIPYE EVLMHGHALM 
PDGRAMSKSK DILVDPHEAI DRHGRDVMRA FLLSNNPQGD DMRFSWEGMQ TMENHLRTLW 
NVFRFPLPYM RLDEFDPQAT TVEDVQADLE LIDEWVLARL QSTKDEMTAH FDERRQDKAL 
NALIDFVVED VSRFYVQAVR ERMWEEEDSA SKEAAYATIY RVLRETVALL APYAPFISEE 
IYGTLTGDAE HDTVHMCDWP TVDETFVDEQ LEEDVAFLRA IEEAGANARQ QAGRKLRWPV 
PRVVVAADDQ RVVDAVERHT PLLEDRLNAR EIELVSPDDR WGELNYSAEA DMSELGPTFG 
DRAGQVMNAL NEARIDEPTL ESIAAAVEDV LESGEEITEE MVSFVTQTPE GVAGTAFGLN 
GDDRGVAYVD ASLTDDIESE GYAREVIRRV QEMRKDLDLD VEERIALELE IEDDRVASLV 
DERADLIREE VRADEFGGDV VDDGHRKEWE VEGVAMEIAI ESLAAPEASE