Gene Sare_1748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1748
Symbol
ID	5705381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2020746
End bp	2021954
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	73%
IMG OID	641271251
Product	glycosyl transferase group 1
Protein accession	YP_001536626
Protein GI	159037373
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0115341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTCGG AGCACGCCAG CCCGCTCGCC GTCCTCGGCG GGGAGGACGC CGGCGGCCAG 
AACACGCACG TCGCCGAACT CTCCGCAGCC CTCGCCGCGG CCGGCCACGA TGTGCGGGTC 
TACACGCGCT GGGACGCGGT CGACCTGCCG GCGACCGTCC GCTGCCCGGA CGGGTACGAG 
GTGGTCCATG TTCCGGCCGG CCCGGCCGAG CCGGTGGCCA AGGACGCGCT GCTGCCCCAC 
ATGAAGGGGT TCAGCCACTG GCTGACGGAT CGCTGGCGCG GCGATCGGTG GACTCCAGAG 
GTGGTCCACG CGCACTTCTG GATGAGTGGT CTCGCCGGGC TCGCCGCCGG CCGCAGGACC 
GGTGTGCCGG TGGTACAGAC CTACCACGCG CTCGGCGTGG TCAAACGGCG GTATCAGGGC 
GTGCAGGACA CCAGCCCGCC CCGCCGTATC GGCTACGAGC GGGAACTCGG CCGATCGGTG 
GACCGGGTGA TCGCCCAGTG CCAGGACGAG GTCGGTGAGT TGGTTCGGAT GGGCGTGCCC 
CGGTCCCGGA TGACGGTCGT CCCGTCCGGG GTCAACCTCC GTACCTTCGC CCCGTTGGGC 
CCCGCCGCCG ACCGCGACGA CGGCCGCCCC CGCATTCTCA CCGTGGGGCG GCTGGTCGAG 
CGGAAGGGTT TCCAGACCGT TGTCCGGGCG ATGGCCCATG TGCCGGACGC GGAGTGCGTG 
GTGGTCGGCG GGCCACCGGC CGGGCTGCTC GAGACCGACC CGTACGCGGG TCGGCTGCGG 
GCCCTGGCGC ACTCGTGCGG GGTTGCTGAT CGGGTGCGGC TGGCCGGCGC GGTGCCCCGG 
GAGGAGATGG GCCGCTGGTA TCGCTCGGCG GATCTGCTGG TGGCCGCACC GTGGTACGAG 
CCGTTCGGGC TGACCCCGCT CGAGGCGATG GCGTGTGGCG TGCCGGTGGT GGGTACCGCG 
GTCGGGGGGA TCAGGGACAC GGTGGTGGAC GGGGTGACCG GTGACCTCGT GCCCGCCCGG 
GACCCCCGTG CGCTCGGTAC CGCGATCCAG CGGCTGCTCG ACGACCGGAT TCGCCGGTTC 
ACGTATGCGA CGGCGGCGCT GGAACGGGTT CGGGAACGCT ACGCGTGGGC TGCCACCGCG 
GAGCGGCTGG TCGAGGTCTA CGGTGACGTG GCGGCTGTGG GCCGGGCGAC CCGGGTGGTG 
GCCGGATGA

Protein sequence

MISEHASPLA VLGGEDAGGQ NTHVAELSAA LAAAGHDVRV YTRWDAVDLP ATVRCPDGYE 
VVHVPAGPAE PVAKDALLPH MKGFSHWLTD RWRGDRWTPE VVHAHFWMSG LAGLAAGRRT 
GVPVVQTYHA LGVVKRRYQG VQDTSPPRRI GYERELGRSV DRVIAQCQDE VGELVRMGVP 
RSRMTVVPSG VNLRTFAPLG PAADRDDGRP RILTVGRLVE RKGFQTVVRA MAHVPDAECV 
VVGGPPAGLL ETDPYAGRLR ALAHSCGVAD RVRLAGAVPR EEMGRWYRSA DLLVAAPWYE 
PFGLTPLEAM ACGVPVVGTA VGGIRDTVVD GVTGDLVPAR DPRALGTAIQ RLLDDRIRRF 
TYATAALERV RERYAWAATA ERLVEVYGDV AAVGRATRVV AG