Gene SeHA_C4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4031
Symbol
ID	6487805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3913415
End bp	3914377
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	56%
IMG OID	642744132
Product	divergent polysaccharide deacetylase
Protein accession	YP_002047737
Protein GI	194447310
COG category	[S] Function unknown
COG ID	[COG2861] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00871141
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCTCAGT TTCGTCGCTC CATTCTCACG CTGGCCACTT TGCTGGCGTT TGCACATCCC 
GTTTTCGCTG GCAAGCTCGC CATCGTGATT GATGATTTTG GCTATCGCCC GCACACGGAA 
AACCAGGTTC TGGCGCTGCC GCCAAACATC TCCGTCGCTG TACTGCCCAA CGCGCCGCAC 
GCGCGCGAAA TGGCAACTAA AGCGCACAAT AGCGGGCATG AGGTGTTAAT CCATCTGCCG 
ATGGCGCCGC TAAGCAAACA GCCGCTGGAG AAGGATACGC TGCGACCAGA TATGAGCAGC 
GATGAGATCG AGCGCATTAT CCGCGAGGCG GTAAACAACG TGCCGTATGC CGTCGGGCTT 
AATAACCACA TGGGCAGCGC AATGACTTCC AGCCTGTTCG GTATGCAAAA AGTTATGCAG 
GCGCTGGAAC ATTACAATCT CTATTTTCTC GACAGCATGA CGATTGGCAA TAGCCAGGCG 
ATGCGCGCGG CATCCGGTAC GGGTGTGAAA GTGATCAAGC GCAAAGTGTT CCTCGACGAT 
ACGCAAAACG AGGCGGATAT CCGTCGTCAG TTTAATCGCG CTATCGAACT GGCCCGTCGC 
AACGGTTCCG CTATCGCGAT TGGTCATCCA CATCCCGCAA CGGTTCGCGT GCTGCAACAG 
ATGGTTTATC GCCTGCCGGC GGATATCACC CTGGTACGTC CAGGCAGCCT GCTCAACGAA 
CCGCAGGTAG ATACGTCCCG ACCTGGTGTG ACGCCGCAGA AAATTGACGC GCCGCGCAAT 
CCCTTCCGCG GCGTAAAGAT GTGCAAGCCG AAAAAACCGC TGCAACCGGT CTACGCTACG 
CGCTTTTTCA GCGTCATCGG CGAGAGCATT ACGCAAAGTT CCGTGGTTAC CTGGTTTCAG 
CACCAGTGGC AAGGCTGGGG GAAAATCGCC GCGCCTAAAA ACGTGAGCGC TAAGACAGAT 
TGA

Protein sequence

MPQFRRSILT LATLLAFAHP VFAGKLAIVI DDFGYRPHTE NQVLALPPNI SVAVLPNAPH 
AREMATKAHN SGHEVLIHLP MAPLSKQPLE KDTLRPDMSS DEIERIIREA VNNVPYAVGL 
NNHMGSAMTS SLFGMQKVMQ ALEHYNLYFL DSMTIGNSQA MRAASGTGVK VIKRKVFLDD 
TQNEADIRRQ FNRAIELARR NGSAIAIGHP HPATVRVLQQ MVYRLPADIT LVRPGSLLNE 
PQVDTSRPGV TPQKIDAPRN PFRGVKMCKP KKPLQPVYAT RFFSVIGESI TQSSVVTWFQ 
HQWQGWGKIA APKNVSAKTD