Gene Nmag_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1503
Symbol
ID	8824337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	1531473
End bp	1532681
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID
Product	hypothetical protein
Protein accession	YP_003479641
Protein GI	289581175
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.396474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCCTGC GATGTTCGCT GCTCGGGCAC GACTACGGGG AATCCGAGGT CGACCGCGAG 
CGCGAAGAAC GGGGCAGTGA GGTCGTCGTC ACCGTCCAGG AGTACGAAGA GTGTGTCCGC 
TGTGGTGACA GACACGTCAT CAGTGAGAAC ACTGAGGTAA CGAGTCTCTC GGCCGCACCG 
GCGACTGAGT CGGACGCGGT TGCTGACGCA GCTGCCACAG CTGACACCGC TGAGACGACT 
GCGACGCAAG ACGCCGACCT GCCCCACGAC GACGTATCGA CAGCCACGTC CACGCCGACG 
TCCCCCACGG ACTCGACTGC GGCCGAGCAA GGCACAACAG AAGAACCCGC TGACGCGACG 
ACAGTCGAGG CGGACGACGC AATTACCGAC GACGCGACGA TCATCGACGG TGATGGCGGT 
GACGATGGTG ATGGTGTCAG TGACGGTGAT GGTGACGGTG AAACTGAGCC TACGCGTGCA 
CACAATGACG TCGAGTCACA CGCCGCAGAT ACCGCCGCCA CTGACGCCGA GACCGCACCC 
GCCTCTGACG GTGCGGACGA ACTCAACGTC CCGACGGACG AGGACGGCAA CCCAGTCACC 
GACGACGGCG AGATACTCGA GGACGAGCCA GCACACGCCA GCGCGGGTGG CGACAGCGAC 
CGCGAGCACG GCGAGTGGCC AGACTCCGAC GACGTCGGCC CGCCAGTCGA CGAGGAAACA 
GATACCGAAC ACGAAGAGTG GCCCGACACG GGCGAGCAGG TCGATGACGA TGCAGTCGTT 
CTCGAACACG ACTCGACGGC CTACGAAGAT GACTCGGCAG CCGATGCCAG AACAGCGACC 
GTCGACGCCA CTGACCACGA ACAGTTCGGT GGATCGCAGG ATGCCGGGCA GCGCGATGAG 
CCAGTGAGCG AATCGAACGC GACCGGGTTT GGGGCGACGG CCGGAACAGG TACCGATACT 
GGTGGCGGTG ACACGACCGC CGCTGCAGCT GAAGCGGAGG CCGAGATGGC CGAAACAGGG 
AGCGGCATCG AACGCGTCGG AGACGCCCCC GCCCCCGGCG ACGCTACCCA TCCAGACGAC 
GACGTGCCGA GCGAGTTCTA CTGTCCACGC TGTGAGTTCG TCGTGAGCAG CGACCGCGGC 
TCGCTTCGGG CAGGCGATAT CTGTCCGGAG TGTCGGAAGG GATACCTCGG CGAACGGGCC 
AGACAGTAA

Protein sequence

MVLRCSLLGH DYGESEVDRE REERGSEVVV TVQEYEECVR CGDRHVISEN TEVTSLSAAP 
ATESDAVADA AATADTAETT ATQDADLPHD DVSTATSTPT SPTDSTAAEQ GTTEEPADAT 
TVEADDAITD DATIIDGDGG DDGDGVSDGD GDGETEPTRA HNDVESHAAD TAATDAETAP 
ASDGADELNV PTDEDGNPVT DDGEILEDEP AHASAGGDSD REHGEWPDSD DVGPPVDEET 
DTEHEEWPDT GEQVDDDAVV LEHDSTAYED DSAADARTAT VDATDHEQFG GSQDAGQRDE 
PVSESNATGF GATAGTGTDT GGGDTTAAAA EAEAEMAETG SGIERVGDAP APGDATHPDD 
DVPSEFYCPR CEFVVSSDRG SLRAGDICPE CRKGYLGERA RQ