Gene Sare_0993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0993
Symbol
ID	5707533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1116197
End bp	1117345
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	74%
IMG OID	641270508
Product	glycosyl transferase group 1
Protein accession	YP_001535895
Protein GI	159036642
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.153198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CCATCGTGAC CGAATCGTTC CCGCCGGACG TGAACGGTGT CGCGCACTCG 
GTGGTGCGGG CAGCAGAGCA CCTGGTCGCC CGCGGACACG AACCGGTGGT CATCGCGCCC 
GCTCCGGGTG GGGCCCGCCG CCACGAGTCG AACCGGCACT CGTACCCGGT GGTCCGCATC 
CCCAGCGTTC CGCTGCCGCG CTACCAGGGC TTCCGGTTGG GCGTACCGAC GCAGGCCCAG 
CTGACCGGCG CGGTGCTGTC GTGCGCCCCC GACATCGTTC ACCTGGCCAG TCCGTTCGTG 
CTCGGGGCAC GGGCCGCGAC CCTGGCGGCC CGGCACGACC TGCCGACGGT TGCCGTCTAC 
CAGACCGACG TCGCCTCATA CGCCCGCGCG TATCGGGTCG GCTGGGGCGA AGCGGCGGTC 
TGGCGGCGGA TCCGCGAGAT CCACAATTCG GCCCAGCGTA CGCTCGCGCC GTCCACCCGG 
GCCGCCGCCG ATCTCGTCGC CAACGGGGTG CAGCGAATCT GGCTCTGGCG ACGCGGCATC 
GACGGCGAGC GCTTCCAGCC GGCGAAGCGG TGCGCCGCGC TGCACCGGGC TCTCGCGCCC 
GGCGGTGAAC TGCTCGTCGG CTACGTCGGG CGGCTTGCCC CCGAGAAGCG GGTCGACCTG 
CTCGAGGCCA CCACCCGCCT GCCCGGCGTC CGGGTCGTGG TCGTCGGCGA CGGGCCGGAC 
CGCCGGCGGC TGGAGTGGTC CCTGCCGGGC GCGGCGTTTC TCGGTGTGCA GCACGGCGAG 
GACCTCGCCC GCCTCTACGC GAGCCTCGAC GTCTTCGCGC ACACCGGCCC ACACGAAACG 
TTCGGCCAGA CGATCCAGGA GGCACTGGCC AGTGGTGTAC CCGTGGTGGC TCCGGCGGCC 
GGCGGGCCGG TCGACCTGGT CAAGTCCGGG GTGACCGGGA CACTGGTGCC GCCCGGCGAC 
GCCGGGGCGC TCGCCGACGC CGTCCGGGCG CTCGCCACCG ACGAAGCCCG CCGGCAGGCG 
TACGCGGCGG CGGGCCGGGC CGCCGTCATC CGCCGCAGTT GGACGGCGGT CGGCGACGAG 
CTGATCGGCC ACTACCGGGC GGTCCTCCGG TCCGGTGCCT CGGCGCTGGA CCTACCCGCG 
GTGTCGTGA

Protein sequence

MRIAIVTESF PPDVNGVAHS VVRAAEHLVA RGHEPVVIAP APGGARRHES NRHSYPVVRI 
PSVPLPRYQG FRLGVPTQAQ LTGAVLSCAP DIVHLASPFV LGARAATLAA RHDLPTVAVY 
QTDVASYARA YRVGWGEAAV WRRIREIHNS AQRTLAPSTR AAADLVANGV QRIWLWRRGI 
DGERFQPAKR CAALHRALAP GGELLVGYVG RLAPEKRVDL LEATTRLPGV RVVVVGDGPD 
RRRLEWSLPG AAFLGVQHGE DLARLYASLD VFAHTGPHET FGQTIQEALA SGVPVVAPAA 
GGPVDLVKSG VTGTLVPPGD AGALADAVRA LATDEARRQA YAAAGRAAVI RRSWTAVGDE 
LIGHYRAVLR SGASALDLPA VS