Gene Nmag_3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3902
Symbol
ID	8826772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	298718
End bp	299878
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	61%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003482005
Protein GI	289583595
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.088151
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAGGG CCCGTCTCTT CACCTCGCTA TGCGTTCTCG TCTTCTTCAT CAACCTCGCC 
AGAATCGTCT TTGCGCCCCT TCTCAACGTC TTTATCAGCG AGTTCGGTAT CGGCGAGGCG 
ACTGCAGGGC TCATCGTCAC GCTCGCCTGG ATCGGGAGTG CGGCCCCGCG CTTGCCGACC 
GGCTGGCTTC TCACGAAAGT TCCCAGACAC TACGTCGTGA TTAGTTCAGG TTCCATTCTC 
GCGGTGTCAT CCGCAATCGC TGCAACGGCG ACGACCGTCG AGCACCTGAT GGTCGGCGCG 
TTCTTCATGG GGATCGCTTC GGGTGTTTAC TTCGTCTCGG CGAATCCACT GCTGAGCGAG 
CTGTATCCGG AGCGGATCGG TCGAGTGATG GGCATCCACG GCGCTGCGAA CCAGATCGCG 
GCCGTCGTCG CTGCGCCGTT CGTCGCACTC ACGCTGTTCG TCGACTGGCG ACTCTCCCTG 
TGGGCGATTG CCGTCGGTGC TGCCATCATC ACTGTCTACA CGTGGTTCGT TGCCCGAGAA 
ACCGAGATGC CCAGTGCGGG ACAGGCGGAT CGCAACTTCG TCGCCGGCGC GCTCTCGGAG 
TGGCGGCTTA TCGCCACCGC GCTCGCTATC GTCGGTTTCG CGGTGTTCGT CTGGCAAGGC 
CTGTTCAACT TCTACGAACT GTACATGATC CAGTCGAAGG GCCTCTCGGA TCGTGCAGCC 
GGGATGATGC TCACGATCGT CTTCGCCACC GGCGTTCCAG CGTTCTACTT CGGCGGTGAC 
TTCGCCGACA GGCTTCCGCA GATTCCGTAC CTCCTCGGTA TCGTCGGCGT CTTCGCCGTG 
AGTGTGATCG TCCTGACGAT GGTCGAGAGC CTGATCGGGT TGATCGTCAT GTCCGTTGTC 
GTCGGCTTCG TCATCCACTC GCTGTTTCCC GCGGTGGATA CGTTCATGCT CGATACGCTT 
CCCGACTCGA CGCGCGGGAG TGCCTACGCC GTGTTTAGTT CGCTCTGGAT GGCGACGCAG 
GCGCTTGGCT CCTCAGCCGT CGGGACGCTC ATCGAACAGG GATATTCCTA CGACGCGGTA 
TTCACTGGCG GTGCGCTCTT GCTCGGTGCC TTGATCGTCG TTCTGACCAT CTTCGAGCGC 
GCCGGCCGAC TACCGACGTG A

Protein sequence

MARARLFTSL CVLVFFINLA RIVFAPLLNV FISEFGIGEA TAGLIVTLAW IGSAAPRLPT 
GWLLTKVPRH YVVISSGSIL AVSSAIAATA TTVEHLMVGA FFMGIASGVY FVSANPLLSE 
LYPERIGRVM GIHGAANQIA AVVAAPFVAL TLFVDWRLSL WAIAVGAAII TVYTWFVARE 
TEMPSAGQAD RNFVAGALSE WRLIATALAI VGFAVFVWQG LFNFYELYMI QSKGLSDRAA 
GMMLTIVFAT GVPAFYFGGD FADRLPQIPY LLGIVGVFAV SVIVLTMVES LIGLIVMSVV 
VGFVIHSLFP AVDTFMLDTL PDSTRGSAYA VFSSLWMATQ ALGSSAVGTL IEQGYSYDAV 
FTGGALLLGA LIVVLTIFER AGRLPT