Gene SeHA_C4644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4644
Symbol
ID	6489749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4538364
End bp	4539719
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	56%
IMG OID	642744712
Product	alpha-galactosidase
Protein accession	YP_002048289
Protein GI	194450343
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACGG CACCCAAAAT TACCTTTATC GGCGCAGGTT CTACGATTTT CGTCAAAAAT 
ATCCTCGGCG ATGTGTTTCA CCGCGAGTCG CTAAAGTCAG CGCATGTCGC CCTGATGGAT 
ATTGACGAAA CCCGGCTGGA AGAGTCGCAC ATTGTGGTAC GGAAACTGAT GGACTCAGCG 
GGCGCTTCTG GCCGGATTAC CTGCCATACC AACCAGAAAG CGGCGCTACA GGATGCGGAT 
TTCGTGGTGG TCGCCTTTCA GATTGGCGGC TATGAACCCT GCACCGTGAC CGATTTTGAG 
GTTTGTAAGC GTCATGGCCT GGAACAGACG ATCGCCGATA CGCTGGGGCC GGGCGGCATC 
ATGCGCGCGC TGCGGACCAT CCCGCATCTG TGGCGGATTT GCGAAGACAT GACGGAAGTC 
TGTCCGAAGG CCACCATGCT CAATTACGTC AACCCGATGG CGATGAATAC CTGGGCGATG 
TATGCCCGTT ATCCGCATAT CAAACAGGTC GGCCTGTGCC ATTCGGTACA GGGAACGGCG 
GAAGAACTGG CGCGCGACCT GAATATCGAT CCCACCTCGC TGCGCTACCG CTGCGCCGGC 
ATTAACCACA TGGCGTTTTA CCTCGAACTG GAGCGCAAAA CGGCTGACGG GACTTATGTC 
AATCTCTATC CTGAATTGCT GGCGGCCTAT GACGCCGGAC AGGCGCCGAA GCCCAATATT 
CACGGCAATG AACGCTGCCA GAACATCGTG CGCTATGAGA TGTTCAAAAA GTTGGGCTAC 
TTCGTCACCG AATCATCAGA GCATTTTGCC GAGTACACGC CGTGGTTTAT TAAACCGGGA 
CGCGAAGATC TGATTGCGCG CTACAAGGTG CCGCTGGATG AATATCCGAA ACGCTGCGTA 
GAACAACTGG CGAACTGGCA TAAAGAGCTG GAGGAGTATA AAACCGCCGA GCGTATCGAC 
ATCAAACCGT CCCGCGAGTA CGCCAGCACC ATTATGAACG CTCTGTGGAC CGGCGAGCCG 
AGCGTGATTT ACGGCAATGT GCGTAATGAG GGGCTGATTG ATAACCTGCC GCAGGGAAGC 
TGCGTGGAAG TGGCTTGTCT GGTGGATGCC AACGGCATTC AACCGACGAA GGTGGGGACG 
ATCCCCTCTC ATCTGGCGGC GATGATGCAG ACCAACATCA ACGTGCAAAC GCTGTTGACC 
GAAGCCATCC TCACGGAAAA CCGCGATCGC GTGTATCACG CGGCGATGAT GGACCCTCAT 
ACCGCGGCGG TGCTGGGTAT CGAAGAAATC TATGCGTTGG TTGACGATCT GATCGCCGCG 
CATGGCGACT GGCTTCCGGC CTGGTTACGC CGTTAA

Protein sequence

MMTAPKITFI GAGSTIFVKN ILGDVFHRES LKSAHVALMD IDETRLEESH IVVRKLMDSA 
GASGRITCHT NQKAALQDAD FVVVAFQIGG YEPCTVTDFE VCKRHGLEQT IADTLGPGGI 
MRALRTIPHL WRICEDMTEV CPKATMLNYV NPMAMNTWAM YARYPHIKQV GLCHSVQGTA 
EELARDLNID PTSLRYRCAG INHMAFYLEL ERKTADGTYV NLYPELLAAY DAGQAPKPNI 
HGNERCQNIV RYEMFKKLGY FVTESSEHFA EYTPWFIKPG REDLIARYKV PLDEYPKRCV 
EQLANWHKEL EEYKTAERID IKPSREYAST IMNALWTGEP SVIYGNVRNE GLIDNLPQGS 
CVEVACLVDA NGIQPTKVGT IPSHLAAMMQ TNINVQTLLT EAILTENRDR VYHAAMMDPH 
TAAVLGIEEI YALVDDLIAA HGDWLPAWLR R