Gene Sare_3491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3491
Symbol
ID	5704762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4026497
End bp	4027774
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	69%
IMG OID	641272918
Product	N-acylglucosamine 2-epimerase
Protein accession	YP_001538284
Protein GI	159039031
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0507934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC ACCTCCCCAC CCGGCCGGCG AACTCACCCG ACCAGATCAC ATCCACCCCC 
CATCAGCGTC TCCTCGTCAC CCAGGCCGAC GCACTGCTTC GCGCCGCCCG TGCCTCGGTG 
CGGCCCGAGG GAGGGTTCTG GTGGGTGACC GAACGTGGCG AACCCGATCC CCGTGAGCCG 
CTCCACACCT GGATCGCCTG TCGGATGACT CATGTCTTTG CCCTCGCCCA CCTCGGACAC 
GCCCCCGACA CCGCCCATGG GGTCGACCAC GGTGTCGCCA CGCTGCGCGG CACGCTGCGT 
GACGCGCGGC ACGGCGGCTG GTTCAGCGCG GTGGATCTGA GTGGTGAACC GGTCACCGAC 
CGGAAATCCG CGTACGAGCA CGCTTTTGTC CTGCTGGCGG CGAGCAGCGC CACCCGTGCC 
GGTAGGCCGG GCGCCGAACA GCTACTGGAC GAGGCGCTCA ACGTGGTACA CGACCGGTTC 
TGGGACGAGG CCGCCGGCCG GACCCGGGAG TCCTGGAACC GTGACTGGTC CGAGTCGGAG 
CCCTACCGGG GCGCGAACAG CAGTATGCAC ATGGTCGAGG CGTTCCTGGC CGCCGGCGAC 
GTCACTGGGG ACCGCCGCTG GGCGCAACGC GCGCTGGCGA TCTGCGATCA CCTGGTGCAC 
GACGTGGCCG CCCGACACCA CTGGCGGCTG CCCGAGCACT TCACCACCGA CTGGGAACCG 
CAGTTGGACT ACAACCTCGC ACAGCCCGCG GACCCCTTCC GGCCATACGG ATCCACCGTG 
GGCCACTGGC TGGAGTGGGC CCGACTGCTG CTGCATCTCG AAACCGCGCT CGCGGCGCCA 
CCTGCCTGGC TACTCGATGA CGCGCGTGCG CTGTTCACCG CGGCGGTCAC CCGTGGCTGG 
TCGGTCGACG GCGCGGACGG CTTCGTCTAC ACCCTCGACT GGACGGACCA GCCGGTCGTC 
CGTTCCCGGA TGCACTGGGT GCTCGCCGAG GCGATCGGGG CCGCTGCCAC GCTCTGGCGT 
CGCACCGGCG ACGAACACTA CGAGCACTGG TACCACGTCT TCTGGGACTA CGCTGGCCGC 
CACCTCATCG ATGAGGACAC CGGACAGTGG CGCCACGAGC TGGACGAGAC GAACCAGCCG 
GCGAGTCTGG TCTGGCACGG CCGTCCCGAC GTGTATCACG CCTACCAGGC CGTCCTTTTG 
TCCCAGTCAC CGATCACGCC CAGCCTCGCG GGTCTGTTCG CTCCCGCGCC GACGAACCAC 
GTGGAGGAGG ACCGGTGA

Protein sequence

MTEHLPTRPA NSPDQITSTP HQRLLVTQAD ALLRAARASV RPEGGFWWVT ERGEPDPREP 
LHTWIACRMT HVFALAHLGH APDTAHGVDH GVATLRGTLR DARHGGWFSA VDLSGEPVTD 
RKSAYEHAFV LLAASSATRA GRPGAEQLLD EALNVVHDRF WDEAAGRTRE SWNRDWSESE 
PYRGANSSMH MVEAFLAAGD VTGDRRWAQR ALAICDHLVH DVAARHHWRL PEHFTTDWEP 
QLDYNLAQPA DPFRPYGSTV GHWLEWARLL LHLETALAAP PAWLLDDARA LFTAAVTRGW 
SVDGADGFVY TLDWTDQPVV RSRMHWVLAE AIGAAATLWR RTGDEHYEHW YHVFWDYAGR 
HLIDEDTGQW RHELDETNQP ASLVWHGRPD VYHAYQAVLL SQSPITPSLA GLFAPAPTNH 
VEEDR