Gene Nmag_3633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3633
Symbol
ID	8826501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	+
Start bp	17694
End bp	18938
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID
Product	peptidase S8 and S53 subtilisin kexin sedolisin
Protein accession	YP_003481744
Protein GI	289583334
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.183359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACACC AACGACAGAC ACGCCGGCGG GTACTACGGG GAATCACAGC AACGGGCCTG 
ACGCTCGGGA TGATCGGGAC TGGCAGCGCA CAGTCGTCGT CGACGTACGT CGTCACCGGG 
GGTGGGCGGA CGCGCCTCGA GAACGCAGGC GCGACGATCA GGCGAGAACT CGCGAACGGA 
TCCGTCTTCA TCGTCTCGGC CGAGGATGGC GCTGCGGACG ACCTGCGCTC CGTTTCGGGC 
GTCAGTGGGG TCACGGAGAA CTTCGAGGTC GAACACGATG GGCCGATTTC AGAGGTGGAG 
CCACAGACGA CCGACGACGC CGAATTCACC GAGAAGCAGT GGGACAAGGA GATTACGGAT 
ACGTTCGAAG CCCACGACTA CGCAACCGGT GAGGGGACGC GAATCGTCAT CGCAGATACC 
GGCGTCGACG GCACGCATCC GGATCTGGAA GCGAACTTTA ACGAGGAGTT GAGCGTCTCG 
TTCGTCGACG GCGGCGAAAA AGATGAACAC ATCGGCGACT CCGGCGACCA CGGCACCCAC 
GTTGCTGGCA CCGCGGCCGC AACCGGTGCA GAAGGGATTA CCGGAACCGC ACCTGACGCC 
GAACTCGTCT CCGTTCGTGT CCTCGGTCCA GATAGTAGCT CCTTCGCGGA CATCCTCGCC 
GCAGCCGACT ACACCGCCGA GATCGGTGCA GACGTCGCGA ACTACAGCCT CGGTGCGGGT 
CCGTTCCCAC CCGAGGCCAA CAGCGACGGT ACTCGAGTCG CCGTCCAGAA GGTGATGCAA 
GATGTCGCCC GTCGTGGGAC GGTGTCGACA GTCTCTGCAG GCAATGCCGA GACCGATCTT 
CAGCGGGGTG GCCTGTTCTA TCTGCCGGGG ACCGTCCAGG GAGTGATGAC GGTTTCGGCG 
AGCGGTCCGG GGGACAACCT TTCGTTCTAC TCGAACTACG GGACGAGTGA GATCGAGGTC 
GGCGCACCCG GTGGTGGCCG GGGGACACTC GAGGAAACTG TCACCCCCGA CGATCTCGTC 
TTCTCGACCG AACCAGACGG GACCTACGGC TGGAAGGCCG GCACGTCGAT GGCTGCCCCG 
CAGGTTGCGG GACTCGTTGG ACTCGTGCGT GAACTCGAGC CTGATGCACA CGCGAACCAG 
GTCGAGAACG CGATCGCACA CGGTGCGGAA CTCGTTCCGG GACGCAGCAG CCCCGAGTTC 
GGCGCTGGTC GAATCAACGC GCTGAACACC GTCAGCAACC TGTAG

Protein sequence

MAHQRQTRRR VLRGITATGL TLGMIGTGSA QSSSTYVVTG GGRTRLENAG ATIRRELANG 
SVFIVSAEDG AADDLRSVSG VSGVTENFEV EHDGPISEVE PQTTDDAEFT EKQWDKEITD 
TFEAHDYATG EGTRIVIADT GVDGTHPDLE ANFNEELSVS FVDGGEKDEH IGDSGDHGTH 
VAGTAAATGA EGITGTAPDA ELVSVRVLGP DSSSFADILA AADYTAEIGA DVANYSLGAG 
PFPPEANSDG TRVAVQKVMQ DVARRGTVST VSAGNAETDL QRGGLFYLPG TVQGVMTVSA 
SGPGDNLSFY SNYGTSEIEV GAPGGGRGTL EETVTPDDLV FSTEPDGTYG WKAGTSMAAP 
QVAGLVGLVR ELEPDAHANQ VENAIAHGAE LVPGRSSPEF GAGRINALNT VSNL