Gene Sare_4362 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4362
Symbol
ID	5706443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4929217
End bp	4930323
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	75%
IMG OID	641273784
Product	glycosyl transferase family protein
Protein accession	YP_001539134
Protein GI	159039881
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.03216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCC CGCACCTGCT CGGCCCGGTC GCCGAGCGCG TATCCGCGGT CGAACGGATC 
GCCGTGCTGC GGGCCAACGC GCTCGGCGAC TTCATCTTCG TCCTGCCGAC GCTGGAGGCG 
CTGCGGGCCG CGTACCCCGC CGCGGAGATC GTCCTGCTGG GCGCACCGTG GCACGCGAAG 
CTGTGGCGCG ACCGGCCGGG TCCGGTGGAC CGGGTCCTGG TGGTCCCGCC GGCTCCCGGA 
ATCCGTCGCC CGGAGCCGGA CGAGCCGGAG TCCGAGTTGG CGGACTTCCT CGCCCGCGCC 
CGCAGGGAAC GCTTCGATCT GGCGCTGCAG GTGCACGGCG GTGGGGCCAA CTCCAATCCG 
GTCGTGGCCG GCCTCGGCGC CCGGGTCACG GCCGGCCTGC GGGCCGAGGA CGCGCCGCCG 
CTGGACCGCT GGCTGCGGTA CGTCTACTAC CAGCACGAGG TGATCCGTTA CCTGGAGGTG 
GCGGCCCTGG TGGGCGCTCC GGCGACCACC GTCACTCCCG CCCTGGCGGT TACCGACGCC 
GACCGGGCCG AGGCGGCCGA GGTGCTCGGC CCGGCGGACC GGCCCCGGGT GGCCTTGCAT 
CCGGGCGCCA CCGACACCCG CCGGCGGTGG CCGGTCGAAC GCTTCGCGGC GGTCGCTCGG 
GAACTGCACG GGGACGGGTA CGAGGTGCTG GTCACCGGCA CCCCGGTCGA ACAGAACGAG 
GTGGACCGTC TGGTGGCGGC GGCCGGGGTG CCCCTCCGGC CGCAGGTCGG CACGCTCAGC 
CTCGGCGGGC TGGCCGGCTG CTACGCCGGC TGCGCGGTGG TGGTCGCCAA CGACACCGGG 
CCGCTGCACC TGGCGGCGGC GGTCGGCACC CCCACGGTCG GCGTCTACTG GGTCGGCAAT 
TTCATCACCA CGGCGAGCCC GCTGCGCGGC CGGCACCGCC CGATCTGTTC CTGGACGGTG 
CTCTGCCCGG TTTGTGGGGT CGACTGCACC CCGGGTAGCT ACCCGCACCG GCCCGGCGAC 
GGCGAGTGCC CGCACCGCGA CTCGTTCGTG GCCGACGTCC CGGTGATCGA GGTCCTCGAA 
GCCACCCGCG ATCTGCTCGG CGGGTAG

Protein sequence

MVAPHLLGPV AERVSAVERI AVLRANALGD FIFVLPTLEA LRAAYPAAEI VLLGAPWHAK 
LWRDRPGPVD RVLVVPPAPG IRRPEPDEPE SELADFLARA RRERFDLALQ VHGGGANSNP 
VVAGLGARVT AGLRAEDAPP LDRWLRYVYY QHEVIRYLEV AALVGAPATT VTPALAVTDA 
DRAEAAEVLG PADRPRVALH PGATDTRRRW PVERFAAVAR ELHGDGYEVL VTGTPVEQNE 
VDRLVAAAGV PLRPQVGTLS LGGLAGCYAG CAVVVANDTG PLHLAAAVGT PTVGVYWVGN 
FITTASPLRG RHRPICSWTV LCPVCGVDCT PGSYPHRPGD GECPHRDSFV ADVPVIEVLE 
ATRDLLGG