Gene Sare_3439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3439
Symbol
ID	5703289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3964155
End bp	3965261
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID	641272866
Product	UDP-N-acetylglucosamine--N-acetylmuramyl- (pentapeptide) pyrophosphoryl-undecaprenol N-acetylglucosamine transferase
Protein accession	YP_001538232
Protein GI	159038979
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0197262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCCGC TGCGTTCGGT GGTGCTTGCG GGAGGTGGCA CCGGGGGCCA CATCTACCCG 
CTGCTCGCCT TCGCCGACTG CCTGCGCCGG CACGACTCCG GCGTCCGGGT CACCTGCCTG 
GGCACCCCCA AGGGCCTGGA GAACGAGCTG ATCCCGCCGG CCGGGTACGA CCTGCGGCAG 
ATCCCCGCGC ACCAGCTTCC CCGTTCGGTC AACCTGGACC TGGTGAAGAC CCCGGGGCGG 
ATGTGGACCG CGGCCCGCGC CGCCGGCAAG GTCATCGACG AGGTGGAGGC CGATGTGGTG 
GTGGGGTTCG GCGGGTACGT CTCGGTCCCG GCCTATCTCG CCGCGTGGCG ACGCGAGCTG 
CCGATCGTCA TCCACGAGGT CAATGTGCCA CCGGGGGTGG CCAACCGACT GGGCATGAAG 
TTCACCAGGC ACGTTGCGGT GGGCTTCCCG CACCAGCCGG CGCAGGCCGA GTCGCTGCGC 
CAGGCCCGGG TAGTCGGGGT ACCGCTGCGC CGGGGTATCG CCGGCCTGGA CCGGGCCGCC 
ATGCGCGATG CCGCCCGCGC CCACTTCGGG CTCCGTCCGG ACCTGCCGGT ACTCTTCGTC 
GCCGGTGGAT CGCAGGGCGC GCGCTCGATC AACCTGGCGG TTTCGGGGGC GGCCAAGGAG 
TTGGCCCGCA ACGGAGTGCA GGTGCTGCAC GTGATCGGTG CGCGTAACGA GACGGTGTCG 
GTGCCGACCG ATTTGCCGGC GCCGTATGTG ACCCTGCCGT ACCTGTCGCA GATGGAGCTG 
GGCTACGCCG CAGCCGATCT GATGCTCGGC CGCGGCGGGG CGATGACCTG CGCGGAGGTG 
GCGGCGATCG GGTTGCCGAC GGTCTACGTT CCGTACCCAC ACAGCAACCA GGAGCAGCGG 
CGCAACGCGT TGCCGGTGGT GGAGGCCGGT GGTGGACTAC TCGTTGACGA CGCTGAGCTG 
ACGCCGGCCT GGGTGGAGGG CAATGTGATA CCGCTGGCCC GCGACCCGCA CCGGCTGGCC 
GCGATGGGGG CTGCCGCCGC CGCGTACGGG AATCGCGACG GCGATGAGGC CCTGCTCAAC 
TTCGTTTACG AGGCGGTGGT CCGGTGA

Protein sequence

MGPLRSVVLA GGGTGGHIYP LLAFADCLRR HDSGVRVTCL GTPKGLENEL IPPAGYDLRQ 
IPAHQLPRSV NLDLVKTPGR MWTAARAAGK VIDEVEADVV VGFGGYVSVP AYLAAWRREL 
PIVIHEVNVP PGVANRLGMK FTRHVAVGFP HQPAQAESLR QARVVGVPLR RGIAGLDRAA 
MRDAARAHFG LRPDLPVLFV AGGSQGARSI NLAVSGAAKE LARNGVQVLH VIGARNETVS 
VPTDLPAPYV TLPYLSQMEL GYAAADLMLG RGGAMTCAEV AAIGLPTVYV PYPHSNQEQR 
RNALPVVEAG GGLLVDDAEL TPAWVEGNVI PLARDPHRLA AMGAAAAAYG NRDGDEALLN 
FVYEAVVR