Gene Nmag_0433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_0433
Symbol
ID	8823257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	422211
End bp	423416
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	65%
IMG OID
Product	protein of unknown function DUF354
Protein accession	YP_003478583
Protein GI	289580117
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACATCG TGATCACAAT ACAGCACGCG GCGAACGTGC ACTTCTTCAA GCACGTCGTA 
GGTGAACTCG AGTCGGCGGG CCACGACGTG TTCGTGTTCG CCCGCGAGAA GGGCGTGGTG 
GGGGAGTTAC TCGACGCCTA CGAGATCGAC CACGAACTGC TCTGCGGGGA GCCACGAGGC 
TGGCTCGGTC TCGGACTGAC GCAGCTCTGT TACGAGGCCC GGCTCCTCCG TCGAGCGCGA 
GCGATCGATC CGGACTACAT CCTGACCAGC CACGGTATCG CCGCCACCCA CGTCGGGACA 
CTGGTCGGTG CGGAGAGTCA CGTCTACATC GACACCGAGA CGACGATCAA CGGCGGGAAT 
CGGCTCACGA TCCCGTTTAC GGACGTGCTC TACACGCCCG AGAGCTTCCG CGAGACGTAC 
GACGCCGAGC ACGTCAGGTA TCCCGGCTAC CACGAACTGG CGTACCTCCA CCCCGACCGG 
TTCGACCCCG ATCCGGATCG GCTGCGCACC CACGGTGTCG ATCCCGACGA CCGGTACGCC 
GTCCTCCGAT TTGGTGCGTG GAACGGCAAT CACGACATCG GAAAGTCCGG GATCTCGGCC 
GCTGGGCGAC ACGAAATCGT CGACGAACTC GCCACCGACG GCCGCGTCTT CGTCGCCGAC 
GAGGGAGATG GTCCGCTGCC AACCAGCGCG GAACCGTTGC CTGTCCCGCC GGCTGACTTT 
CATCACCTGC TCGCGTTCGC CGACCTCGTC GTCGGCGAGG TCGCGACAAC GACACTCGAG 
GCCGGCCTCC TCGGAACGCC GACCGTTCGA ATCAGCCCCT TCGCCGGCAC GTCGGAGATG 
GGGAAGTTCC GCGAACTCGC AGAGTACGGC CTCGTCCGCT CGTTTCATAC GGATCACGAG 
ACGACGGCGA TTCGCGAACT GACGCGACTC TATCGCGATC CGAGCGCCGC GTCGAACTGG 
GCAGACAGAC GCGAGGCGCT GCTCGCGACG AAAATCGATG TCACGCAGTA CATTCTCAGC 
CAGATTCTCG CGGACGTACC TGAGCCGACG CCCGAGGACC GGGATTCGGG ACCGACGCTG 
GCAGCGTCCG GTTCTGGACC CAGCTCCGGT TCCGACGCCG GATCTGAGGC TCTGAATCAC 
CCCGGACCAT GTCCAGAAAC AGAATCCCCG CCGAGGCCGG ACCGGCCATC GGTGAACCGG 
AACTGA

Protein sequence

MDIVITIQHA ANVHFFKHVV GELESAGHDV FVFAREKGVV GELLDAYEID HELLCGEPRG 
WLGLGLTQLC YEARLLRRAR AIDPDYILTS HGIAATHVGT LVGAESHVYI DTETTINGGN 
RLTIPFTDVL YTPESFRETY DAEHVRYPGY HELAYLHPDR FDPDPDRLRT HGVDPDDRYA 
VLRFGAWNGN HDIGKSGISA AGRHEIVDEL ATDGRVFVAD EGDGPLPTSA EPLPVPPADF 
HHLLAFADLV VGEVATTTLE AGLLGTPTVR ISPFAGTSEM GKFRELAEYG LVRSFHTDHE 
TTAIRELTRL YRDPSAASNW ADRREALLAT KIDVTQYILS QILADVPEPT PEDRDSGPTL 
AASGSGPSSG SDAGSEALNH PGPCPETESP PRPDRPSVNR N