Gene Sare_3004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3004
Symbol
ID	5707614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3412094
End bp	3413071
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	68%
IMG OID	641272451
Product	Acetyl xylan esterase
Protein accession	YP_001537819
Protein GI	159038566
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3458] Acetyl esterase (deacetylase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000183119
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGCAGT TCGACATGCC GCTCGACCAA CTCCGCGCCT TTCGGTACGA CGAGACGGAG 
CCAGCGGACT TTGACGTGTT CTGGGCCAAG ACGCTCGGTG AGGTCCGCCA CCATGAACTC 
GACGTCGTGC AGTGTCCCGT CGACACCCGG CTGCGCACGG TGACGGTCGA CGATGTGGCG 
TTCAACGGGT TCGGCGGCGA CCGGGTACGG GCGTGGCTGG TCCGCCCGGC CGGTCTCGCC 
GGACCGTTGC CGGCCGTGGT GGAGTTCATC GGGTACGGCG GCGGTCGCGG CCTGCCTCAC 
GAGAAGCTGC TCTGGGCATC AGCGGGATTC GCGCACCTCG TTGTGGACAC GCGCGGCCAG 
GGCGGCCTGT GGAGCGTGTC CGACACACCC GACCCGTACG GTACCGGCTC GAGCGCTCCC 
GGGTTCCTCA CGCGCGGGAT CAGCTCGCCT GAGGACTACT ACTACCGGCG CGTGTTCAGT 
GACGGAGTGC GTGCCGTCGA AGCCGTCAGG ACACTACCCG TCGTTGACGC AAGCCGCGTC 
ATCGTCACCG GTTCGAGCCA AGGCGGCGCC ATCGCACTGG CTGTCTCCGG GCTGGTGCCC 
GACATCGCCG GTGTCGCCGC GCGCTCACCC TTCCTCTGCG CGATCCGACG TGCGGTCGCC 
GTGACCGACA GCGATCCCTA CGCCGAGCTC CGCCGGTTCC TTGGCATCCA TCGCCATGAG 
ATCACGCATG CCTTCGGCGT GCTGGGATAC TTCGACGGAG TCTTCATGGC GCGACGGGCG 
AGACGCCCCG GGTGGTTCTC GGCCGGGCTG ATGGACGACG TGTGCCCGCC GTCGAGCGTG 
TTCGCTGCGG CCAACGAGTT CGCAGGTCCC GTACACGTCG AGGTGTGGCC CTACAACGGG 
CACGAAGGCG GCGGGGTCGA CGACGACCGG CTGCTTCTCG ACTGGGGCGC CAACCTCGTG 
GCAGGTCCCG ATGAGTGA

Protein sequence

MTQFDMPLDQ LRAFRYDETE PADFDVFWAK TLGEVRHHEL DVVQCPVDTR LRTVTVDDVA 
FNGFGGDRVR AWLVRPAGLA GPLPAVVEFI GYGGGRGLPH EKLLWASAGF AHLVVDTRGQ 
GGLWSVSDTP DPYGTGSSAP GFLTRGISSP EDYYYRRVFS DGVRAVEAVR TLPVVDASRV 
IVTGSSQGGA IALAVSGLVP DIAGVAARSP FLCAIRRAVA VTDSDPYAEL RRFLGIHRHE 
ITHAFGVLGY FDGVFMARRA RRPGWFSAGL MDDVCPPSSV FAAANEFAGP VHVEVWPYNG 
HEGGGVDDDR LLLDWGANLV AGPDE