Gene Nmag_3931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3931
Symbol
ID	8826801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	+
Start bp	334625
End bp	335818
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	66%
IMG OID
Product	hypothetical protein
Protein accession	YP_003482034
Protein GI	289583624
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACACT CACGCACAGC CGCAGTTACC GGGATCGGAT TACTCCCGAA CGGAACGCAC 
TCGAGTCCCG AACGAGAACT CGCACTGACT GTCCTTCATG ACGCGCTGGC GGACGCGAGA 
TTGTCGCCCG AAGCGATCGA CGGGCTCTAC ATGCCCGCGC CGCGGCCGTG GGCGGCGCAG 
AAGTTCGTCT CGACCACGCT CGTCCACAGA CTCGGCATCG AACCCGACCG GACGCTCGAG 
GTGTCGACCG GCGGCTCGAG TAGCGCAAAC GCGTTTCAGA CCGCTGTCCA CGACGTTCGA 
CACGGCGTCG TCGACACGGC GGTCGTCCTC GCCGCCGAAC GGAGTTCGAT CGTTGAGACG 
ACCGGTCCCT ACTTCGAGTA CATCCTCAGC ACGTTCGACG CGGAGTTCGA ATCCCCAATC 
GGGCTATCGG TGCCGGGGGC CTACGCCCAG AGCATGCAGC GGTACTGTTA CGAACACGAT 
ATCGACCGCG ACGATATCGC CGACATCGTC GTGAAAAACC GCGAGAACGC GGCCGACGAT 
CCGGACACCC TGTTCAGCGA CGGGGTCGAT CGGGTGGACG TACTCGAGTC CCGGCCGATC 
GCAGAGCCGA TTCGGCTGTA CGACTGTCCG GCACCGTGTG ATGGGGCGGC GGCGCTGGTG 
GTGACAGCCG ACGATGGTGG GGAGACGGAC ACAGAATCTG GAAACGGTGG CGACCCACCG 
ATCACGGTCG CCGGAGTCGG CAGCCACCAC GCGGCGAGTC ACTTCCTGCA GACCCACGGC 
GAGCCGATCA CCGAACTCCC CGCGGTTCGG CGAGCAGCCC GGACGGCGAG CCAGGAGGCC 
GGACTGGCAC CAGATGAGCT GGACGTCTAC GAGCCGTACG CGCCGTTTCC GCACATCGAG 
GCGATCATCA CCGAGGAACT CGGTCTGGTC GACCGCGGGG AGGGCGTCAC AGCGTGTCTC 
GACGGTCAAA CGCGACCTGA CGGTTCGTTC CCGATCAGCC CCTCCGGCGG CTGTCTCGGC 
CGGGGCCACC CGCCGATGGT AACGCCGTTG TACAACTACG TCGAGGCCGT CCGCCAGCTC 
AGGGGAACGG CCTCGACGCA GATTGTAGAC GCCGAGCACG TCATGACGAC CGCAGAGCAC 
GGCCACGTCA ACGGCGCGAC CGCCACCGTC TTCGCGAGAG GGAGGGGTGC GTAG

Protein sequence

MGHSRTAAVT GIGLLPNGTH SSPERELALT VLHDALADAR LSPEAIDGLY MPAPRPWAAQ 
KFVSTTLVHR LGIEPDRTLE VSTGGSSSAN AFQTAVHDVR HGVVDTAVVL AAERSSIVET 
TGPYFEYILS TFDAEFESPI GLSVPGAYAQ SMQRYCYEHD IDRDDIADIV VKNRENAADD 
PDTLFSDGVD RVDVLESRPI AEPIRLYDCP APCDGAAALV VTADDGGETD TESGNGGDPP 
ITVAGVGSHH AASHFLQTHG EPITELPAVR RAARTASQEA GLAPDELDVY EPYAPFPHIE 
AIITEELGLV DRGEGVTACL DGQTRPDGSF PISPSGGCLG RGHPPMVTPL YNYVEAVRQL 
RGTASTQIVD AEHVMTTAEH GHVNGATATV FARGRGA