Gene Strop_0331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0331
Symbol
ID	5056769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	382614
End bp	384062
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	71%
IMG OID	640472603
Product	glycosyl transferase, group 1
Protein accession	YP_001157194
Protein GI	145592897
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03449] UDP-N-acetylglucosamine: 1L-myo-inositol-1-phosphate 1-alpha-D-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGAATT ACCGATCCCC GATCGGGAAG ATGACACCTG GCGTGGAGGT TGACCGAGAA 
GCGCCGGTCG TGCGGGCGGC AACCGTGGCA GAAGGAGCGG ACGTGGCGGA ACAGCACACC 
GGTGTCGGTC ATCAGCGAGG TGCCCGTCCG TGGCCCCTGC CCCGCCGTAT CGCGACCCTC 
TCCGTGCACA CCTCGCCGCT GCACCAGCCT GGCACCGGTG ACGCCGGCGG GATGAATGTC 
TACATTCTGG AGGTCGCCCG GCGATTGGCC GAGGCGAACG TCGAGGTCGA GATCTTCACC 
CGGGCGACCG CGGCCGACCT ACCGCCGGTG GTCGAGATGG TGCCGGGTGT GCACGTCCGG 
CACATCATGT CCGGCCCGTT GGGTGGGCTG ACCAAGGAGG AACTGCCCGG CCAGCTCTGC 
GCGTTCACCG CGGGGGTGCT TCGGGCCGAG GCCGTCCGGG CCGCGGGGCA CTACGACCTC 
ATCCACTCGC ACTACTGGCT CTCCGGGCAG GTCGGCTGGC TGGCCAAGGA GCGTTGGGGG 
GTTCCGCTGG TGCACACCGC GCACACCCTC GCCAAGGTCA AGAATGCGCA ACTCGCCGCC 
GGGGACCGGC CGGAGCCCAA GGCTCGGGTG ATCGGCGAGG AGCAGGTGGT GGCGGAGGCC 
GACCGCCTGG TCGCCAACAC CAAGACCGAG GCCGGTGACC TGATCGACCG GTACGATGCC 
GACCCGACCC GGGTTGAGGT GGTCGAACCG GGGGTGGATC TGGCCCGGTT CTGCCCTGCC 
TCCGGTGATC GCGCGCGGGC GCAGGTCCTC GCCCGTCGTC GGCTGGACCT GCCCGAGCGC 
GGCTACGTGG TGGCGTTCGT CGGCCGGATC CAGCCGCTCA AGGCACCCGA CGTGCTGATC 
CGTGCGGCGG CGGCGTTGCG CCAACGGGAT CCGGCCCTCG CCGATGACAT GACGGTGGTG 
GTCTGCGGTG GCCCCAGCGG TAGCGGGCTC GAGCGGCCGA CCCACCTGAT CGAGCTGGCC 
GCCGCGTTGG GCATCACCGA TCGGGTCCGG TTCCTGCCGC CGCAGACCGG CGACGACCTG 
CCCGCCCTGT ATCGGGCGGC CGACCTGGTG GCGGTCCCGT CCTACAACGA GAGCTTCGGG 
CTGGTGGCGT TGGAGGCGCA GGCCTGCGGT ACGCCGGTGG TGGCGGCCGC GGTCGGCGGC 
TTGAACACCG CGGTACGCGA CGAGGTCAGC GGGGTCCTCG TGGATGGCCA CGACCCGGTC 
GCATGGGCCC GTTCGCTGGG CCGCCTGCTG CCGGACGCCG GCCGGCGCGC GATGTTGGCC 
CGGGGCGCGC AACGCCACGC CCGCAACTTC TCCTGGGATC GGACGGTGAA AGACCTGTTG 
GATGTCTACG GCGAGGCGGT CGCCGAGCAC CGAACCCGAT TGTCTGACTT CGCCACCTGC 
TCTCGGTGA

Protein sequence

MRNYRSPIGK MTPGVEVDRE APVVRAATVA EGADVAEQHT GVGHQRGARP WPLPRRIATL 
SVHTSPLHQP GTGDAGGMNV YILEVARRLA EANVEVEIFT RATAADLPPV VEMVPGVHVR 
HIMSGPLGGL TKEELPGQLC AFTAGVLRAE AVRAAGHYDL IHSHYWLSGQ VGWLAKERWG 
VPLVHTAHTL AKVKNAQLAA GDRPEPKARV IGEEQVVAEA DRLVANTKTE AGDLIDRYDA 
DPTRVEVVEP GVDLARFCPA SGDRARAQVL ARRRLDLPER GYVVAFVGRI QPLKAPDVLI 
RAAAALRQRD PALADDMTVV VCGGPSGSGL ERPTHLIELA AALGITDRVR FLPPQTGDDL 
PALYRAADLV AVPSYNESFG LVALEAQACG TPVVAAAVGG LNTAVRDEVS GVLVDGHDPV 
AWARSLGRLL PDAGRRAMLA RGAQRHARNF SWDRTVKDLL DVYGEAVAEH RTRLSDFATC 
SR