Gene Strop_0939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0939
Symbol
ID	5057383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	1054456
End bp	1055601
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	71%
IMG OID	640473209
Product	glycosyl transferase, group 1
Protein accession	YP_001157794
Protein GI	145593497
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.872922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.705324
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGCCG GCAGCCCGCC CCGTGTGCTC ATTGACGCCA CGAGTGTTCC CGCCGATCGT 
GGCGGCGTCG GTAGATATGT TGACGGCCTG CTCGGCGCGC TCGGGAAGGT CTGCGGCACC 
AGCGTTGACC TGGTCGTGGT CAGCCTTCGG ACGGATCTTG AACGCTATAC CCGGATGCTG 
CCCGGGGCGG AGATCATCCC CGCCCCGGCC GCTGTGGCGC ACCGGCCCGC GCGGCTCGCC 
TGGGAACAGA CCGGCCTGCC GCTGCTCGCC CAGCAGGTCG GCGCCCAGGT GCTGCATTCG 
CCCTTCTACA CCTGCCCGCT GCGGGCGGGC TGTCCGGTCA CCGTGACCGT GCACGACGCC 
ACCTTCTTCA CCGAGCCAGA GCACTACGAC AAGTCCCGTC GCACCTTCTT CCGCAGCGCG 
ATCCGGACGT CGTTGCGCCG CGCCGACCGG GTGATCGTGC CCAGTAAAGC CACCCGGGAC 
GAGCTGATTC GGCTGTTGGA CGCTGACCCG ACCCGGATTG ATGTCGCGTA CCACGGGGTT 
GATCATGTCG CGTTCCACGC CCCGAGCGCC GAGGAGAAGG CCCGGGTCCG GGCCCGGCTG 
GGGCTCGGCA GCCAGAGCTA CGTCGCGTTC CTCGGTGCCA AGGAGCCCCG CAAGAACGTT 
CCCAACCTCA TTCGGGGCTG GGCGCGGGCC GTGGCGGACC GGCACCAGCC GCCAGCCCTG 
GTGGTCGCCG GGGGGCAGGG GCACGACGAC GAGATCGATC GCGCGGTCGC CGAGGTGCCG 
TCGCACCTGC GCCTGCTCCG CCCCGGTTAC CTGCGCTACG CCGACCTGCC GGGTTTCCTC 
GGTGGGGCCT TGGTCTCCGC CTACCCGTCG TACGGCGAGG GGTTCGGCCT GCCGATCCTG 
GAGGCGATGG CCTGTGCGGC GCCGGTGCTG ACGACGCCCC GGCTCTCTCT GCCCGAGGTG 
GGCGGCGAGG CGGTCGCGTA CACCAGCGAG GCACCGGATC AGATCGCCGC CGACCTGGCC 
GCGTTGCTCG ACGACGAACA CCGCCGGCTG GCGCTGGCCC AGGCCGGGTT CGACCGGGCC 
AAGGAGTTCA CCTGGCAATC CAGCGCCGAC GTGCACCTCG CCGCCTGGTC GCGGGCCCGG 
TCGTGA

Protein sequence

MTAGSPPRVL IDATSVPADR GGVGRYVDGL LGALGKVCGT SVDLVVVSLR TDLERYTRML 
PGAEIIPAPA AVAHRPARLA WEQTGLPLLA QQVGAQVLHS PFYTCPLRAG CPVTVTVHDA 
TFFTEPEHYD KSRRTFFRSA IRTSLRRADR VIVPSKATRD ELIRLLDADP TRIDVAYHGV 
DHVAFHAPSA EEKARVRARL GLGSQSYVAF LGAKEPRKNV PNLIRGWARA VADRHQPPAL 
VVAGGQGHDD EIDRAVAEVP SHLRLLRPGY LRYADLPGFL GGALVSAYPS YGEGFGLPIL 
EAMACAAPVL TTPRLSLPEV GGEAVAYTSE APDQIAADLA ALLDDEHRRL ALAQAGFDRA 
KEFTWQSSAD VHLAAWSRAR S