Gene Nmar_0194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0194
Symbol
ID	5772997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	176568
End bp	177590
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	30%
IMG OID	641315812
Product	glycosyltransferase family 28 protein
Protein accession	YP_001581528
Protein GI	161527702
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR00661] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.775118
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCTTG TAAATTTTTT TTCTAGTCCA ATAGGATTAG GTCATGTAAC AAGAGATATT 
GCAATCAAGA ATAATTTCCA AAATATTACA ACTAATTTTG TTACAGGTAG TGGTGCTGCT 
AAAATTCTAA AGAAATTAGA AATTCAGGTT GATGATGTAT ATCATCCACC ATCATTCATT 
GTTGAGAATG GTACATTGAA AAGTCCTGCA AAATGGCTTT GGAATTACTA TCAATACTAT 
AAAGATTGTA AAAACATTTC ACGAAATATT TTAGAAAAAA ATAGATCTAA TATTGTGATT 
AGTGATGAGG ATTTTGCTTC ACTAACAGTA GCTCAAGAAA TGAAAATTCC AACTATTTTG 
GTTACTGATA TTTTAGAGAC ACATTTTACA AAAGGTCTAG CATCATTTAT CGAAAAAAAG 
ATGAATAAAT CAATGCAAGA GATCATAAAA AAATGTGAAA TTGTCATATT GCCAGAAATA 
GGTGATGCAC AAGACAACAT ACAAAGAGTA GGACCCATAG TACGACAAAC AGATCACACT 
AGAGAACAAT TACGAGAAAA ATTTTCATTT GATAAAAAAA CAATTGTTAT TTCAATTGGT 
GGAACTGATG CAGGATTGTT TTTAATTGAA AAAGCACTAG AGGCAATTAC AAAAATCAAT 
CAAGATGTTA AAATTGTACT AGTTTCAGGT CCATCAGTTG AAAAAAAATT TGAGAATGTA 
GAAAATTTGG GATTTGTAGA AAATTTGCAT GAAATAATTT TTGCAGCTGA TGTGTTAATT 
TCACTTGCAG GAAAATCAAC AATTGATGAG GCTAATGCAT ATGGTACGCC CGCAATATTC 
ATTCCAATTA AAGGTCATTT TGAACAAGAG GATAATGCGA AAGAACAAGG ATTTGTTTTT 
GAAGATATCA AAAGACTTGA CAAGTTAATT CTATCAAAAT TAGAAGAAAA GAGAAATAAA 
GTCAATACCG AAGGTGCAGT AAAAGCTGCA AAAATCATTC AAAGCTTAAT AGATAACTAT 
TGA

Protein sequence

MVLVNFFSSP IGLGHVTRDI AIKNNFQNIT TNFVTGSGAA KILKKLEIQV DDVYHPPSFI 
VENGTLKSPA KWLWNYYQYY KDCKNISRNI LEKNRSNIVI SDEDFASLTV AQEMKIPTIL 
VTDILETHFT KGLASFIEKK MNKSMQEIIK KCEIVILPEI GDAQDNIQRV GPIVRQTDHT 
REQLREKFSF DKKTIVISIG GTDAGLFLIE KALEAITKIN QDVKIVLVSG PSVEKKFENV 
ENLGFVENLH EIIFAADVLI SLAGKSTIDE ANAYGTPAIF IPIKGHFEQE DNAKEQGFVF 
EDIKRLDKLI LSKLEEKRNK VNTEGAVKAA KIIQSLIDNY