Gene Nmag_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_4038
Symbol
ID	8828772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013924
Strand	+
Start bp	79285
End bp	80712
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	61%
IMG OID
Product	cytochrome bd ubiquinol oxidase subunit I
Protein accession	YP_003482129
Protein GI	289937527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0832301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGAAC CGCTGTTGAT CGACCCCGAA CTGGGGAGTC GCATTCAGTT CGGCGGCACG 
CTTTCGGTCC ACATTGTCTT CGCCGCCCTC TCGGTCGGGC TCGCCCCCTA CATCGTCTAC 
TTCACTTACA AGGAAATCTC GACGGGTCGT GAGAAGTACG AACGGTTGCG CTCGTTCTGG 
ACGAAAATCT TCGCCATCGG GTTCGTGATG GGCACGGCGA CGGGGATCCC AATGAGCTTC 
CAGTTCGGGA CGAACTTTCC CGCGTTCTCG GAGTTCGCCG GTGAACTCAT CGGCGGCCCC 
CTCGCCTTCG AGTCGACGAT GGCATTCTTC CTCGAGGCCG TCTTCCTCGG TGTCCTGTTG 
TTCGGCCGCG AACGAGTTAG CGACCGCGTC TACGTCCTCT CGTCGGTGCT CGTGATGGTC 
GGTGCGTGGC TTTCGGCGCT GTGGATCCTC ATCGTCAACT CCTGGATGCA GACGCCCCAG 
GGTTACGAAC TGATCGAGGA AAACGGCGTG ACAGGACTCG TACTCACCGA TCCCATTGCG 
GCGTACTTCA CCCCACGGCT GTTCTGGATG TACGTCCACA TGCAGAACGC GGCGGTGATC 
TCAGTGACGC TCTTCGTCGC CGGCGTCGCC GCCTACTTCG TCTGGACGAA CCCCGACAGC 
GAGCCCTGGC GCGGGACGCT CAAGCTCTCT GTCGGCGTCC TCGCGATCAC CTCGATCTTC 
CAGGTGATCC ACGGCGACAT GTACACTCGC CACGTCGTCC AGACGCAGCC GATGAAGTTC 
GCCGCCATGG AGGCAATCTA CGAGACCAAA GAGGGCGCCC CGTTGCACCT GCTCGCGTTC 
CCGCGCAGTC TCGAAGATAT CACCAATCCG CGGGCCGAGG AACTGTTCAC GGTCAGTATC 
CCGTATCTGG CGTCGTTTCT CGCCGAGACC GACCCGACTG GTATCGTCTA CGGCCTCGAG 
GAGTTTGACG TACAGAACCC ACCGGTCGCG TACGTCTTCT GGTCGTTCCG GACGATGGTG 
TTTCTCGGCT TCTGGTTCAT CTTCCTTGGT CTGTGGGGCG TCTACCGGAT GCGAAAGGGC 
GTGCTCTTCG AGCGTGGACG CTACCTCAAA GCGCTCCTGG CCTCGATCCC ACTCGGCTTC 
GTCGCGACCA TCGTCGGCTG GTACGTCACC GAGATCGGCC GCCAGCCCTG GATCATCCAG 
GACGTCCAGC TTACGAGCGA GGGTGTCTCT CAGACGCTCA CATCGACACA GATGACGATC 
TCGCTTTCCG CCTTTGCGAT CGCCTACGCG ATCCTCGTCG TTCTGTTCCT TCGGGTGATC 
AAATGGATCG TCGACGGCGA ACTCGAGCGG GTTCTCGAGG ACGACTTCGA ACGGGTCGAG 
CAGGAACAGA CCGACGAACG AGCGCCGAGT GGCTCCGGTG AGGTGTGA

Protein sequence

MIEPLLIDPE LGSRIQFGGT LSVHIVFAAL SVGLAPYIVY FTYKEISTGR EKYERLRSFW 
TKIFAIGFVM GTATGIPMSF QFGTNFPAFS EFAGELIGGP LAFESTMAFF LEAVFLGVLL 
FGRERVSDRV YVLSSVLVMV GAWLSALWIL IVNSWMQTPQ GYELIEENGV TGLVLTDPIA 
AYFTPRLFWM YVHMQNAAVI SVTLFVAGVA AYFVWTNPDS EPWRGTLKLS VGVLAITSIF 
QVIHGDMYTR HVVQTQPMKF AAMEAIYETK EGAPLHLLAF PRSLEDITNP RAEELFTVSI 
PYLASFLAET DPTGIVYGLE EFDVQNPPVA YVFWSFRTMV FLGFWFIFLG LWGVYRMRKG 
VLFERGRYLK ALLASIPLGF VATIVGWYVT EIGRQPWIIQ DVQLTSEGVS QTLTSTQMTI 
SLSAFAIAYA ILVVLFLRVI KWIVDGELER VLEDDFERVE QEQTDERAPS GSGEV