Gene Sare_2280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2280
Symbol
ID	5706039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2618388
End bp	2619617
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	71%
IMG OID	641271759
Product	glycosyl transferase family protein
Protein accession	YP_001537130
Protein GI	159037877
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.851942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00376489
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATCGACG CTACCGCATC CCGAGCCGCA CGGGTCCGAC CCGCGGGCAC GGCGCCCGTA 
CTGGACGTGG TGGTGCCCGT CTACAACGAG GAGACCGACC TCGGGCCGTG CGTGCGGCGG 
CTGCACACGC ACCTACGCGA GCATGTCCCG TACCCGTTCC GAATCACGAT CGCGGACAAC 
GCCAGCGTCG ACGGCACATT GGACGTGGCC CGGTCACTGG CCACCGACCT GACCGGCGTC 
GAGGTGCTGC ACCTGGACGC CAAGGGCCGG GGGCGGGCGT TACGGGAAGC CTGGACCGCC 
TCGCCCGCCC CGGTGCTCGT GTACATGGAC GTCGATCTTT CGACCGATCT GGCGGCTCTG 
CTGCCGCTGG TCGCGCCGCT CATCTCCGGT CACTCTGACC TGGCCATCGG CACCCGGCTC 
GCCCGCACCT CACGGGTGGT CCGGGGGGCG AAGCGGGAGG TGATTTCGCG GGCGTACAAC 
CTGTTGCTGC GGGGTGCCCT CGCCGCCCGG TTCTCCGACG CACAGTGCGG ATTCAAGGCG 
ATCCGAGCCG ACGTTGCGGC CCGGCTGCTG CCGCTGGTCC GGGATACCGG ATGGTTCTTC 
GACACCGAGT TGTTGGTCCT CGCCCAGCGG GCCGGCCTGC GCATCCACGA GGTGCCGGTG 
GACTGGGTGG ACGATCCGGA CAGTCGGGTG GACGTCCTGG CCACTGCCCT GGCCGACCTG 
CGTGGTATCG GCCGCCTGGG GCGAGCTCTG CTTACCGGTG AGCTGCCGCT GCGGCAGCTG 
CGTGAGCAGG TCGGACGCGC GCCGTTGGGG CCACCACCGG CCCGGGTGCC GGTGGGGCTG 
CCCCGGCAGC TGGCCCGGTT CGCCGTGGTC GGGGCGGTCA GCACGGTGGT CTATCTGCTG 
TTGTACGTGT CCACTCGGGG CGTCCTCGGT GCGCAGCCGG CGAACCTGCT GTCGCTGTTG 
GTCACCGCGG TGGCCAACAC GGCGGCGAAC CGGCGACTGA CCTTCGGGAT CACCGGCCGG 
TGGCACGCCG GCCGCCACCA CCTGCAAGGC CTTCTGGCCT TCGGGCTCGG CCTGGCGTTG 
ACCAGCGGCT CGCTCGCCGT GCTGCACACC CTCGCGGTGG CCCCGGCGCG TGCGGTGGAG 
CTGGTGGTGC TGGTCGTGGC GAACCTGGCC GCCACGGTGT TGCGGTTCGT GCTGCTCCGT 
TACGCCATGC ACCACCGGCG GGGCGGCTGA

Protein sequence

MIDATASRAA RVRPAGTAPV LDVVVPVYNE ETDLGPCVRR LHTHLREHVP YPFRITIADN 
ASVDGTLDVA RSLATDLTGV EVLHLDAKGR GRALREAWTA SPAPVLVYMD VDLSTDLAAL 
LPLVAPLISG HSDLAIGTRL ARTSRVVRGA KREVISRAYN LLLRGALAAR FSDAQCGFKA 
IRADVAARLL PLVRDTGWFF DTELLVLAQR AGLRIHEVPV DWVDDPDSRV DVLATALADL 
RGIGRLGRAL LTGELPLRQL REQVGRAPLG PPPARVPVGL PRQLARFAVV GAVSTVVYLL 
LYVSTRGVLG AQPANLLSLL VTAVANTAAN RRLTFGITGR WHAGRHHLQG LLAFGLGLAL 
TSGSLAVLHT LAVAPARAVE LVVLVVANLA ATVLRFVLLR YAMHHRRGG