Gene Nmag_3841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3841
Symbol
ID	8826711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	230592
End bp	232103
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	66%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003481944
Protein GI	289583534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.260308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGT TCGACCCGTT CGGCCGTCAC ATCTTCGCCG ACGGCACCTT CCGCGAGAGC 
GAGTCACTCG AGTCCATGGA CGTAATCGAC CCTGCGACCG AGGAACCCGT CGGCTCCGTT 
GCGGTCTGTG ATCCCGACGA GGTCGAGGCC GTCATCGAGG GAGCCGTCGA GGCACAGTCA 
GCGTGGGGCG ACGAACCCGC AGGGACACGT GCAGCAGCGC TCCACGAGGT TGCAGATTCG 
ATCGAGGCGG ACGATTTCGA GCGCATCGCG ACGCTGATGA CGAGAGAACA CGGCAAGCCC 
TTCCCCGAAT CGGAGGGCGA ACTCGCAAAC GTCGCGGGCA TCTTCCGCTA CTACGCCGAA 
CTGGCGCGCG ACGACCAGGG GAACGTCCCC GGCTCGACGC AGGCGGAGTC GTTCCAGTTC 
GACCGGGCGT TTCCCTACGG CGTCACCGTT CACATCGTCC CCTCGAACTT CCCCGTCCTG 
CTAACGGCCT GGACAGTCGC TGCCTCGCTC GCGGCCGGCA ACGCTGTGAT CGTCAAGCCG 
TCCGAGCAGA CGCCGCTCTC GACGCTCCAG TTCATAGAGC ACTTCAAAGG GCTTCCCGAC 
GGCCTCGTCT CGTGTCTCAC CGGCCGCGGC GAAACCGCAC AGGCGATGAT CCAGTCGGAC 
GGGACGGACG CCGTCGCGTT CACCGGCGGC GTCGAAACCG GACAGCAGGT GAGCACAGCG 
GCCGGCAAGC AGCTGATGCC CGCCGTCATC GAAGCCGGCG GCAACGACCC GCTCATCGTC 
ACCGAGCACG CGCCCATGGA GGTCGCAATC GCCGGCTCGA CCACCGCAGC GTTCCATCTC 
TCCGGACAGG TCTGTACCGC CGCCGAGCGG TTCTACGTCC ACGACGCCGT CCACGACGAG 
TTCGTCGACG GCCTCGTCGA GATGACCGAG GCACTCCGCG TCGGCAACGG CTTCGAATCC 
AGCGAGATCG GCCCGCTCGT CAGCGAGGCC GCCCGCGACA ACGTCGAGCG ACTGGTGGAG 
GATGCCCTCG AGAAGGGCGC GACACTCGAG TGCGGCGGGC AGGTGCCACC GGAGCAGGAA 
ACGGGCTGGT TCTACGAGCC GACAGTGTTG ACAGACGTAA CGCCGGAGAT GGCCATCGTC 
CGCGAGGAGG TGTTCGGCCC GGTTGCGCCG ATCTGTCGCG TCGAGAGCTT CGAGGAGGCG 
CTCACGGAGG CGAACAACTC CGAGTTCGGA CTGGGCGCGT CGGTCTTCAC GACGGATCTC 
GAGGAGGCGA TGCGAGCCTA CGAGACGCTG GAGGCGGGCA TGGTCTGGAT CAACAATCCG 
ATGATCGACA ACGACGCGAT TCCGTTCGGC GGCTGGAAAC ACTCCGGCAT TGGCCGCGAA 
CTCGGCCGGC AGGGGCTGGA TGCGTTCCGC CAGACGAAGA TGGGGGTCAT CGACTGGAAC 
CCGCAGGTTC ACGACTGGTG GTATCCCTAC CCCGAGGAGT GGTTCTACGA CACCGAGGAG 
AAGCGGTTCT GA

Protein sequence

MTEFDPFGRH IFADGTFRES ESLESMDVID PATEEPVGSV AVCDPDEVEA VIEGAVEAQS 
AWGDEPAGTR AAALHEVADS IEADDFERIA TLMTREHGKP FPESEGELAN VAGIFRYYAE 
LARDDQGNVP GSTQAESFQF DRAFPYGVTV HIVPSNFPVL LTAWTVAASL AAGNAVIVKP 
SEQTPLSTLQ FIEHFKGLPD GLVSCLTGRG ETAQAMIQSD GTDAVAFTGG VETGQQVSTA 
AGKQLMPAVI EAGGNDPLIV TEHAPMEVAI AGSTTAAFHL SGQVCTAAER FYVHDAVHDE 
FVDGLVEMTE ALRVGNGFES SEIGPLVSEA ARDNVERLVE DALEKGATLE CGGQVPPEQE 
TGWFYEPTVL TDVTPEMAIV REEVFGPVAP ICRVESFEEA LTEANNSEFG LGASVFTTDL 
EEAMRAYETL EAGMVWINNP MIDNDAIPFG GWKHSGIGRE LGRQGLDAFR QTKMGVIDWN 
PQVHDWWYPY PEEWFYDTEE KRF