Gene Spro_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3994
Symbol
ID	5602645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4428834
End bp	4430114
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	52%
IMG OID	640939554
Product	polysaccharide deacetylase
Protein accession	YP_001480217
Protein GI	157372228
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGTCTA CACACAAGAT AGCGGCTGGG TTACTCGGCA TTCTATTATC CCTTGCCGCC 
CCGGCAAGCC TGGCAAATTT GTTGTCGGAA GACAGTGCCG TTAAATCCGA ATATATGGAA 
GCGCAACGCG ACAGTGAGGT TTATTCGCTG ATTGGCGAGC ATGTCATTCC AGTCGGTGAA 
GTGAAGCAGG GGCAACTGAT CCAGGTGTTC CCGGCGGATG CGGAATATTA CGAGTTCAAA 
TTCGGCCACG GCACGGGTTT TATCGATAAA GACGATGTGC GAGAGCTTAA AAAATCACGC 
AAGGTGAAAG ACGATCTGGG GGAGTTGAAT AAACCGCTGA CTAACCAGAA CCTGATCACG 
CAGAAGGCGA TCAACGTCTA TACCGATGCG GATAACACCA GCGATGTGTT TGGAGTACTG 
GAACAGAACC TGCGCTACCC GATTATCGGC AAGCTGAAAG ATCGGCTCAA CAACACCTGG 
TATGAGGTCA ATATTGGCGA TCGCCTGGGT TATGTCAGTG AGCTGGACTG CGAGATTGAC 
ACCGGTATAC CGATACTGAC CTATCATCAT CTGCTGAAAA ACGAAGAGAA CAAGCGCTTC 
CGCCATACCT CGACGACCAC CTCTGACGTG GCGTTCAGTA ACCAGATGAC CTATCTGAAG 
CAGGCGGGCT ACGACACCAT TTCCCTGTAT CAGTTGGAAG CCTACCTGAA AAACCAGATC 
AATCTGCCGG GCAGGGCGGT GGTGCTGACA TTTGATGACG GACTGAAATC GGTCTATCGC 
TACGCTTACC CGGTCTTGAA GAATTACGGC TTCCGTGCCA CGGCGTTTAT TATTTCTTCA 
CGCATCAAGC GTCACCCGCA GAAGTGGAAC CCAGACTCGC TGCAGTTTAT GAGCATTTCC 
GAGCTGAAGC AGATTCAGGA CGTGTTCGAC GTGCAGTCGC ATACCCATTT CCTGCATCGT 
ACCGACGGTA ATCGTCAACC GATCCTGCTC AGTCGTTCGC TGCACAATAT TGAATTCGAT 
TTTGAGCGCT CACGTCGCGC GCTGTCGCAG TTTAATCCGC ATGTGCTGTA TGTCTCCTAC 
CCATTTGGCG GCTACAATCA GCGGGCGATA CAGGCTGCGA AAGACGCCGG TTTTCATATG 
GCGGTGACCA CGGTGCAGGG CAAGGTGAAA CCGGGGGATA ACCCCTATAC GCTGAAACGG 
CTGTATATCT TGCGCACCGA CTCGATTCAG ACCATGGCGG ACAGAATAGC CAATAAGCCA 
GGAACGCTGG TGGTGCAATA A

Protein sequence

MRSTHKIAAG LLGILLSLAA PASLANLLSE DSAVKSEYME AQRDSEVYSL IGEHVIPVGE 
VKQGQLIQVF PADAEYYEFK FGHGTGFIDK DDVRELKKSR KVKDDLGELN KPLTNQNLIT 
QKAINVYTDA DNTSDVFGVL EQNLRYPIIG KLKDRLNNTW YEVNIGDRLG YVSELDCEID 
TGIPILTYHH LLKNEENKRF RHTSTTTSDV AFSNQMTYLK QAGYDTISLY QLEAYLKNQI 
NLPGRAVVLT FDDGLKSVYR YAYPVLKNYG FRATAFIISS RIKRHPQKWN PDSLQFMSIS 
ELKQIQDVFD VQSHTHFLHR TDGNRQPILL SRSLHNIEFD FERSRRALSQ FNPHVLYVSY 
PFGGYNQRAI QAAKDAGFHM AVTTVQGKVK PGDNPYTLKR LYILRTDSIQ TMADRIANKP 
GTLVVQ