Gene Nmag_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2034
Symbol
ID	8824877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	2071958
End bp	2073694
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	66%
IMG OID
Product	Pyrrolo-quinoline quinone beta-propeller repeat protein
Protein accession	YP_003480166
Protein GI	289581700
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGAAC ACGATCGGCG GCGCGTGCTG AAGCGAACTG GACTCGCAAC AGTCGGTGCG 
ACACTCGCAG CGGCGAGCAC GTCGAGTGCC AGCGCTGAGA CCGGCACCGA CACGACAGGA 
GCGTCGACGA CAACCACTCA CTCAGCCGTC GGTGCTGACA CGACTGTCAC CGAGACAGCC 
GGCTGGCCAT CGATCGGCGG TACTCCCGGA AACAACCCGG TCGTCGAGCC GGCAGCCGAA 
CCCGAGCCGC CAGTATACGT CGCCTGGGAG TACGAACACG CCGGCCCGAC GGCGATCGTC 
GACGACACCG TCTATCTCAC CACCGACGGC GAGGTCCACG CCCTCGACGC AGCCGACGGG 
GCACTCGAGT GGGCCACCCA CAACATTGGT GCGAGCGGGA CGCCCGCGGT GCGAGGTGAC 
ACCGTCCTGG TCGGCGGCGA GCGCCTGACG CTGATCGACG CTGCCGACGG CGAGATTTGC 
TGTCAGCACG ATCTCGGCTA CGACGGGGCG CTGGCCTCGC CCGTTGTCGC GGGCGACTAC 
GCGTTCACGG TCGGTGACGG GACCCTGTTC GCGTTCGACA TCGACCCGCG CGAGGTCGCC 
TGGGAGTTTA CACCAACAGC CGATACTGAC GAGCACGAAC CGCTGTACGA ACAGCCCGTC 
GCCGTCGGCG GCGGGGCCGT CGTCGCCGTC AGCGAGAGCC ATGCAGTTGC GTTCGAACTC 
GAGGACGGCA CCAAGCGTTG GCGGGTCGAC GACCCCGTCG GTGATGACGA ATACAGCCGG 
TTCATGGAAC CGAACCCGCG CCAGACGAGC TACCCGGTCG CGACGGACGA GGTCGTGGCG 
ATCGGCAGCG TGGACACGGG CGATGCTTCG ATGTGGCCGC TTGGCTACAC AACGCTGTAC 
GACGTGGAGA CCGGCGAGCG GCGGGTCACG AGCGAGCGCT CGACGTTCGA TCCGGGTGCA 
ATCACCGACG AGCGGTTCTA CGCCCTTGAC TCGCACAATG TCAGGGGCTA CGACCGGGAC 
AGCGGCGAGG AAAGCTGGGA TCCAAGCAGT ATCACGTACC GCGTCCCCTC GATAGCCGTC 
GGCGACGGAA TCGTCTATGC AGGACTGACG CTCGACGGGG CTGGATACGA CCCGGACGAG 
GACGACGTAC CAGAGCACTA CGACGGCGTG TACGCCTTCG ACGCGGATAC CGGTGAGATC 
GAGTGGTCGG TCGGAACGGA CGGCATTCCG CATATCGCAC TCGCGAACGA GACGGTCTAC 
GCCAGTTCGG AAACGCTCGT AGCGCTCCGT TCGGAGAACG ACGACTGGCA CGAGGAGGAG 
GCGGACACGG CGGACGACGA GGGTGGGGAC GAATCCGACG ATACGACAGA CGAGGCAGCG 
GGCGAGGAGG AGAGCGAGGA CACCACCAGT GAGGAGAGTG AGACGGACAC AGACAACGAC 
ACTGGCACTG ACACGGACGC TGACACTGGC ACTGACACGG ACGCTGACAC TGGCACTGAC 
AACGAGACCG AAAACAACTC GACCGGATCG GCCGACGGAA ACGGCGGAAC CAACGAAACC 
GCCGACAAAT CCACCGAATC TGAAGCCGAC TCGAACGACA ACGACAACAA CAAGGACGGC 
ACGCCCGGCT TCACCGCCGG CGCGGGCGTC CTCGGTGCTG GAGCGACACT CGAGTGGCTC 
CGCCGACGGG CCGGCGGTGG AAGCAATGCG AGCGGTGGTA CTGACCGACG CGAGTAA

Protein sequence

MVEHDRRRVL KRTGLATVGA TLAAASTSSA SAETGTDTTG ASTTTTHSAV GADTTVTETA 
GWPSIGGTPG NNPVVEPAAE PEPPVYVAWE YEHAGPTAIV DDTVYLTTDG EVHALDAADG 
ALEWATHNIG ASGTPAVRGD TVLVGGERLT LIDAADGEIC CQHDLGYDGA LASPVVAGDY 
AFTVGDGTLF AFDIDPREVA WEFTPTADTD EHEPLYEQPV AVGGGAVVAV SESHAVAFEL 
EDGTKRWRVD DPVGDDEYSR FMEPNPRQTS YPVATDEVVA IGSVDTGDAS MWPLGYTTLY 
DVETGERRVT SERSTFDPGA ITDERFYALD SHNVRGYDRD SGEESWDPSS ITYRVPSIAV 
GDGIVYAGLT LDGAGYDPDE DDVPEHYDGV YAFDADTGEI EWSVGTDGIP HIALANETVY 
ASSETLVALR SENDDWHEEE ADTADDEGGD ESDDTTDEAA GEEESEDTTS EESETDTDND 
TGTDTDADTG TDTDADTGTD NETENNSTGS ADGNGGTNET ADKSTESEAD SNDNDNNKDG 
TPGFTAGAGV LGAGATLEWL RRRAGGGSNA SGGTDRRE