Gene Sare_3605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3605
Symbol
ID	5706630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4161022
End bp	4162170
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	641273029
Product	polysaccharide pyruvyl transferase
Protein accession	YP_001538394
Protein GI	159039141
COG category	[S] Function unknown
COG ID	[COG2327] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03609] polysaccharide pyruvyl transferase CsaB

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.808806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000648077
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACCTG GCACTGGCCT GACCATCGGT GTGCTCGGCT CGTACGGCGG TCGTAACCTC 
GGTGACGAGG CAATCCTCAC CGGCCTCCTG GCTGACCTGC AGGAACAGGA GCCGAACGCC 
CGTATCATCG TGTTCTCCCG CAATCCCGAC CACACCCGGT CGGCCCACCC GGAGGTGGAG 
GCGGTGCCCT GGGAGGGGGT GAGCCGCACC GACTCGTCAC CGGTGCTCGC CCAACTCGAT 
CTGCTCATTC TGGGTGGCGG CGGCATCCTC TACGACCGGG AGGCACGCCG CTACCTGCGG 
GTCGTCCGGG TTGCCCAGGA GCGCGGCCTG CCGCTGCTCA CGTACGCGGT GGGGGTCGGC 
CCACTCAGCG AGATCGTGGA CACCGGGATG GTGCGCGAGA CCCTGGCCGG GGCGACCCAG 
GTCACGGTGC GGGACCAGGA ATCGCGCATG CTCCTGGAGG AGGCCGGGCT ACTCAACCCG 
ATCACGGTCA CCGCGGACCC GGCGTTTCTG CTCGAGGCCG AGGACTTCCC CGCGCACCTG 
CTCCGGGAGG AGGGGGTACC GGCGGGCCGG CGGCTGGTCG GCATGAGCGT GCGCGAGCCG 
GGCCGAGCCG CCGAACGCCT CGACGTTGAC GGGTACCACC GGCTCTTGGC CCAGATCGGC 
GACTTCCTCG TACACCGGAT CGACGCGGAT GTCCTTTTCG TTCCGATGGA GCGGGACGAC 
ATCCGGCACT CCCACGGCGT GCTGTCACAC ATGATCGCCG CCGAGCGAGG CCGTATTCTG 
CACGGTAGCT ACTCACCCCA GCAGGTGCTC GGTTTGATGC GCCACTTCGA CCTGGCCGTC 
GGCATGCGGC TGCACTTTCT GATCTTCGCC GCGATGGCGA ACACTCCGTT CCTGCCCCTG 
CCGTACGCAG GTAAGGTCTT CGACCTGGCT CAGCGGCTTG GCGTCCCCGC CCTGCGGGGA 
GTGGAACGGG AGGTCGAGGG CCCGCTGTTG GCCGAGGTCG ACCGGCTGTG GGACGAGCGG 
GACCAGCGCG CCGAGGCCAC CGCCCGACGG GTCGCCGAGG TGTGCGAGGA AGCCCGGGGC 
ACCTCCAAGG TGACCCGGTC GGTGCTGGAC AGTCTCCGGA CCCAGGCGAT GGTCTCCGTC 
GACGCGTGA

Protein sequence

MTPGTGLTIG VLGSYGGRNL GDEAILTGLL ADLQEQEPNA RIIVFSRNPD HTRSAHPEVE 
AVPWEGVSRT DSSPVLAQLD LLILGGGGIL YDREARRYLR VVRVAQERGL PLLTYAVGVG 
PLSEIVDTGM VRETLAGATQ VTVRDQESRM LLEEAGLLNP ITVTADPAFL LEAEDFPAHL 
LREEGVPAGR RLVGMSVREP GRAAERLDVD GYHRLLAQIG DFLVHRIDAD VLFVPMERDD 
IRHSHGVLSH MIAAERGRIL HGSYSPQQVL GLMRHFDLAV GMRLHFLIFA AMANTPFLPL 
PYAGKVFDLA QRLGVPALRG VEREVEGPLL AEVDRLWDER DQRAEATARR VAEVCEEARG 
TSKVTRSVLD SLRTQAMVSV DA