Gene Nmag_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_0143
Symbol
ID	8822962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	158096
End bp	159313
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	35%
IMG OID
Product	O-antigen polymerase
Protein accession	YP_003478299
Protein GI	289579833
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.697441
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAAA ATGACTGGAA AGGATATATA GTAAATATCT TGTTTGTATT TCTATTGATT 
ATTATATTAT TACCTAGTAC GGTAGTTGTT AATACAACAA TAGGGAACGC ATCATCTATA 
ATTCTAACCT TTTTGTTCCT AATAATAATA TATTCAATAT ATGGTGGAGT GGCTGTTGAG 
TATGTTAAGT CCATCGGAAT TGCTTTTTTC ATAATATTTC TTGTGTTGCT GTATCACATA 
CATAATGGGC GTTACAACCT CGCGCACAAT GCATTTTATC CAATCTATGG CGTTCTTTAC 
CCAGTTATAT TCATGTTTAT CTTCCCCAAT TACATAAATT ACAGAGTGAT ATCAAAGGCT 
ATCGCAGTGT TTTCGTCAGT GGTCGTAATC ATTGGGTTGC CAGCACTCAT AATCGGAACA 
TATGATTTAT TTTGGTTTCA AGTCCAGGCA GTTGAATATA GTTCTGTAAC CCGGTTGAGA 
TCAATCTTCG AAGGTAGTCA AAATTCACTA GGCAGGTTTT TAATGATTGG TTCAATATTC 
GCCTTCTCAG AGTATCATAA CACAAGCAAT ACACTTTGGG GGGGAGTAGT AGCTATAAAC 
ATATTTGGGT TATATTTGAC TGGTAGCAGA GGAAGTCTTG CTGCCTTTTC TATAGGTTTC 
TCTATTTACT TAATATACTA TTTTTACAAT AAGGAGATTT ATAAGAAAGT GTATGCAATA 
GTTCTCTTTG GATACTCGTC AGCACTTCTT TTCTTTTTTG GACTAATACC TTGGCCAAAT 
ACAATCAAAA GCATTGATTT CAGTCATAGA TTTGAGATAT GGGATGCTAC CCTGAACGCC 
TCTTCAAATA ATATCATTTT AGGAAACGGA TTAGTACCCC GGAGCGAATT GATAGCCCCA 
TATCTTTATA CACCAGAAAT AATGGGGGTG AATCCACATA ATGGGTATTT ATCAATTTTA 
CTGTATTCTG GTATAATTGG ACTCATTTCA TACCTCTCCA TTATATACCA GGTTTTACTT 
CTGTCCATTG CTAGAGATGA GTCAAACGTC CTAATGATGT CTGTTTCCAT CTCAATCCTA 
ACCGAATCTT TTGTAGAAGA TGTTATGATC ATTGGAACCG GCTTCAGTAC AATAATCTTA 
TCTATGTGTT TTGGGTACTT GATTAAGGAG AGTGAAATTA GTAATAGAAT AATCATCAAG 
CAGAAAACTA CTGACTAA

Protein sequence

MDQNDWKGYI VNILFVFLLI IILLPSTVVV NTTIGNASSI ILTFLFLIII YSIYGGVAVE 
YVKSIGIAFF IIFLVLLYHI HNGRYNLAHN AFYPIYGVLY PVIFMFIFPN YINYRVISKA 
IAVFSSVVVI IGLPALIIGT YDLFWFQVQA VEYSSVTRLR SIFEGSQNSL GRFLMIGSIF 
AFSEYHNTSN TLWGGVVAIN IFGLYLTGSR GSLAAFSIGF SIYLIYYFYN KEIYKKVYAI 
VLFGYSSALL FFFGLIPWPN TIKSIDFSHR FEIWDATLNA SSNNIILGNG LVPRSELIAP 
YLYTPEIMGV NPHNGYLSIL LYSGIIGLIS YLSIIYQVLL LSIARDESNV LMMSVSISIL 
TESFVEDVMI IGTGFSTIIL SMCFGYLIKE SEISNRIIIK QKTTD