Gene SeHA_C0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0204
Symbol
ID	6489911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	210214
End bp	211443
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	50%
IMG OID	642740483
Product	polysaccharide deacetylase domain-containing protein
Protein accession	YP_002044157
Protein GI	194451211
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTATGC GCGTTGTTCT TATCTTGCTG TTCTTTTTCG CCGGTAATGT GTTGGCTGCC 
TTGCCCGCTC GTTATATGCA AACGACGAAA GATGCCGCCA TCTGGTCGCA GATTGGCGAC 
AAAATGGTGA CCGTAGGGAA TATCCGTGCC GGACAAATTC TTTCCGTAAC GCCTGTTGCG 
GCTGATTATT ATGCCTTTAA ATTCGGCTTC GGTGTGGGCT TTATCGATAA AGGCCATCTG 
GAATCCGTGC AGGGAAAACA AAAAGTGGAA GATGGCCTGG GCGATCTTAA CAAGCCGCTC 
AGCAATCAGA ATCTGGTGAC CTGGAAGGAC ACGCCGGTGT ATAACGCGCC GGACATCAGT 
AGCGCCCCGT TTGGCGTATT GGTGGATAAT TTGCGTTACC CCATTATTAG CAAGCTGCAA 
GGCCGGCTAC ATCAAACCTG GTATCAAATC CGTATTGGCG ACAGGCTGGC TTATGTCAGC 
GCCATGGATG CGCAGGAAGA CAACGGCATT CCGATTTTGA CCTATCATCA CATCTTACGT 
GATGAAGAGA ATACTCGTTT TCGCCATACG TCCACCACGA CTTCGGTTCG GGCATTCAGC 
AACCAAATGA CCTGGCTTCG CGATCGCGGC TATGCCACGT TGACGATGTA CCAACTGGAG 
GATTACATCC ATAACCGCGC GAATTTCCCG GCGCGCGCGG TGGTTATCAC CTTTGACGAT 
GGCCTTAAAT CGGTGAGTCG CTATGCGTAT CCGGTATTAA AGCAGTACGG TATGAAAGCG 
ACGGCATTTA TTATCTCATC GCGTATTAAG CGCCATCCGC AAACATGGAA TCCCAGGTCG 
CTGCAATTTA TGAGCGTGTC CGAATTGCGC AAGATAAGCG ATGTTTTTGA TTTTCAGTCG 
CATACCCATT TTTTACACCG GGTAGACGGG CATCGCCGCC CGATTTTATA TAGCCGCAGC 
TACCATAATA TTCTGTTTGA TTTTGAACGT TCGCGGAGGG CGCTCACACA GTTTACTCCG 
CACGTATTTT ATCTTTCTTA TCCCTTTGGC GGCTATAACG CGACCGCGAT CAAAGCAGCA 
AAAGACGCCG GTTTCCATCT GGCGGTCACC ACGGTGAGAG GGAAGGTGAA GCCGGGAGAT 
AATCCGATGC TGCTCAAAAG GCTGTATATT TTACGCACGG ATTCGCTGGA AACGATGTCG 
CGGCTGATAG TCAATCAGCC GCAGGGGTAG

Protein sequence

MVMRVVLILL FFFAGNVLAA LPARYMQTTK DAAIWSQIGD KMVTVGNIRA GQILSVTPVA 
ADYYAFKFGF GVGFIDKGHL ESVQGKQKVE DGLGDLNKPL SNQNLVTWKD TPVYNAPDIS 
SAPFGVLVDN LRYPIISKLQ GRLHQTWYQI RIGDRLAYVS AMDAQEDNGI PILTYHHILR 
DEENTRFRHT STTTSVRAFS NQMTWLRDRG YATLTMYQLE DYIHNRANFP ARAVVITFDD 
GLKSVSRYAY PVLKQYGMKA TAFIISSRIK RHPQTWNPRS LQFMSVSELR KISDVFDFQS 
HTHFLHRVDG HRRPILYSRS YHNILFDFER SRRALTQFTP HVFYLSYPFG GYNATAIKAA 
KDAGFHLAVT TVRGKVKPGD NPMLLKRLYI LRTDSLETMS RLIVNQPQG