Gene Nmag_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2022
Symbol
ID	8824864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	2060248
End bp	2061492
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003480154
Protein GI	289581688
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGATC AGAACGACGA TGGCGAGGAA TTCGATGCGA TCGACACGGA GATGGCTCGT 
TGGTGGCGAA TGAGACGCTG GCGATACAGC GAGACAGTGC TCGCGCTGTG TACACTCGCG 
TTCTTCGCGA CGATGGTTGG CCGGTTGGCG ATCAGTCCGG TCTTGCCGAT GATCACTGAG 
GACTTCGATG TCACCAACTC GGTCGTTGGC GTCGCGATGA CCGGGATGTG GATGGCCTAC 
TTCCTCTCGC AGTATCCGAG CGGGATCTTC GCAGACCGCT ACGGCGAGCG ACCGATCATT 
CTGATCGCCG TCGGCGGGAC GGCAGTGACG AGTCTCTTTC TCGCACTGTC GCCCTTCTTC 
GCGGTGTTCG TTTTCGGAAC GATTGCACTG GGTGCCGTCG CCGGCCTCCA CTATAGTGTC 
GCGACGACGC TTCTGACCCG GACCTACGAC GATATCGGTG CTGCCATCGG GGTTCACAAC 
AGCGGTGGCC CCGCTGCGGG TCTCGTCGCA CCGCCGATCG CTGGCTGGGT CGGTGTCACC 
TACGGCTGGC GAGCGGCCGT CGCAATCGCC GTTCCCATCG CGATTCTGGT CTACGTGCTA 
TTCTCCCGGT TTATCGACCC AACAGAGCCT CGGCGACCGA ACCAGTCCAT GCAGGAACGC 
GTCGACGTCG GGGCGATCAC GGACCTCCTC TCGCGGCCGA AGATTGCGTT CCCAATCTGT 
CTCGCCATCG CCGCGGCGTT CGTCTGGCAG GCAACCTCAA CCTTCCTCCC CACGTTCCTC 
ACCGAACACC GAGAGCAGTC GACCGAACTT GCAGCTGTCG TCTTCGCGAG CTACTTCGTC 
GTGCAGGCAA TCACGCAGGT TGGTGTCGGC GCCGTCTCGG ACCGCGTCGG GCGTGACTTC 
GCGACGGCTG GCTGTCTGCT CCTTGCGGGA GTCGGCTTCG TGATTTTCGT CGTTGGTCCC 
GGATTCGAAG CCGTCGTCGT CGGAGTGGTA CTGGTCGGAA CCGGTCTCGG CTGGGGAGCA 
GCGCTTCTCC CGCGGTTTAT GGATGTCCTC TCTGACGAGG AACGCGGTGC CGGATTCGGA 
CTCATCCGCA CGGTGTACGG CTTCATCGGC GCGCTCGGTT CGGTCGCGAC CGGGCTGTTT 
GCCGACCTCT TTGGCTGGGG GGTTGCATTC CTCGTGTTGG CTGGCCTTCT CGGACTTGGG 
TTCTGTGCGA TTCTGGTCAA CTGGCTGTTC TCGCTCGGGT ATTGA

Protein sequence

MNDQNDDGEE FDAIDTEMAR WWRMRRWRYS ETVLALCTLA FFATMVGRLA ISPVLPMITE 
DFDVTNSVVG VAMTGMWMAY FLSQYPSGIF ADRYGERPII LIAVGGTAVT SLFLALSPFF 
AVFVFGTIAL GAVAGLHYSV ATTLLTRTYD DIGAAIGVHN SGGPAAGLVA PPIAGWVGVT 
YGWRAAVAIA VPIAILVYVL FSRFIDPTEP RRPNQSMQER VDVGAITDLL SRPKIAFPIC 
LAIAAAFVWQ ATSTFLPTFL TEHREQSTEL AAVVFASYFV VQAITQVGVG AVSDRVGRDF 
ATAGCLLLAG VGFVIFVVGP GFEAVVVGVV LVGTGLGWGA ALLPRFMDVL SDEERGAGFG 
LIRTVYGFIG ALGSVATGLF ADLFGWGVAF LVLAGLLGLG FCAILVNWLF SLGY