Gene SeHA_C4341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4341
Symbol
ID	6490635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4231577
End bp	4233613
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	56%
IMG OID	642744427
Product	alpha-glucosidase
Protein accession	YP_002048016
Protein GI	194450429
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1501] Alpha-glucosidases, family 31 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGC AAAGTAAGCA TTTATCCTCT GTCCTGATAG AAAAGAACAT TGAGGGCTTT 
ACGCTGACGT ACCACCAGCG CCTGATTTTA CGCCACAGCG CCGAAACCCC CTGTCTGTGG 
ATTGGCGCGG GCGTTGCCGA CATTGACATG TTTCGCGGCA ACTTCAGCAT CAAAGACAAA 
CTTAACGAGA AGATTGCATT AACGGAGGCC ACCATCAGCG AGCTACCTGA CGGCTGGCTG 
GTACAATTCA GCCGTGGCGC AACAATTAGC GCCACCCTTC GCATCTCCAC CGATGAGGCG 
GGACGCCTGC AGCTGGATCT GCAAAACGAC GACCTGCACC ATAACCGTAT CTGGTTACGC 
CTCGCAGCTA ATCCAGACGA CCATATCTAC GGCTGCGGCG AACAGTTCTC TTATTTCGAT 
TTGCGCGGCA AGCCGTTCCC GCTGTGGACC AGCGAACAGG GCGTTGGCCG TAATAAAACC 
AGCTATGTCA CCTGGCAGGC AGACTGTAAA GAGAACTCCG GCGGCGACTA TTACTGGACC 
TTCTTCCCGC AACCGACCTT TGTCAGCACG CAGAAGTATT ACTGCCACGT CGATAATAGC 
TGCTATATGA ATTTCGACTT CAGCGCGCCG GAGTATCACG AACTGGCGCT GTGGGAAGAT 
AAAACTACGC TACGTTTTGA GTGTGCCGAC ACCTACATCG CCCTACTGGA AAAACTGACT 
GCGCTGTTAG GTCGCCAGCC GGAGCTGCCG GACTGGGTTT ACGACGGCGT CACGCTAGGC 
ATTCAGGGCG GTACGGAAGT TTGCCAGCAA AAACTGGATA CCATGCGCAA CGCAGGCGTA 
AAAGTGAACG GTATTTGGGC GCAGGACTGG TCCGGTATCC GCATGACCTC CTTTGGCAAA 
CGCGTGATGT GGAACTGGAA GTGGAATAGC GACAACTATC CGCAACTGGA TAGCCGGATC 
AAACAGTGGA AAGAAGAAGG CGTACAGTTC CTCTCTTATA TCAACCCATA CGTCGCCAGT 
GATAAAGACC TCTGCGCCGA GGCGGCGAAA CACGGCTACC TGGCGAAAGA CGCCACGGGC 
GGCGACTATC TGGTCGAGTT TGGCGAATTC TATGGCGGCG TGGTCGATCT GACCAATCCT 
GAAGCTTACG ACTGGTTCAA AGACGTCATC AAAAAGAACA TGATCGCGCT CGGCTGCAGC 
GGCTGGATGG CAGATTTCGG CGAATATCTG CCGACCGACA CGTATCTGCA CAACGGCGTC 
AGCGCCGAGA TCATGCATAA CGCCTGGCCC GCGCTGTGGG CGAAGTGTAA CTACGAAGCG 
CTACAGGAGA CCGGCAAGCT CGGCGAGATC CTGTTCTTTA TGCGTGCGGG TTACACCGGC 
AGTCAGAAAT ATTCCACCAT GATGTGGGCA GGCGACCAGA ACGTTGACTG GAGCCTTGAT 
GATGGTCTGG CCTCTGTCGT GCCTGCGGCA TTGTCGCTGG CGATGACCGG CCATGGTCTG 
CATCACAGCG ATATCGGCGG CTACACCACC CTGTTTGACA TGAAACGCAG CAAAGAGTTG 
CTGCTGCGCT GGTGCGATTT CAGCGCCTTT ACGCCGATGA TGCGCACCCA TGAAGGCAAC 
CGCCCCGGCG ATAACTGGCA GTTCGACGGC GACGCGGAAA CTATTGCCCA CTTTGCCCGC 
ATGACCACCG TCTTTACCAC GCTGAAACCG TACCTCAAGC AGGCGGTGGC GCAAAACGCG 
GCTACCGGTC TGCCGGTCAT GCGTCCGCTA TTCCTGCACT ACGAGAACGA TGCCGCAACC 
TACACCCTGA AATATCAATA TCTGCTCGGT CAGGATCTGC TGGTCGCGCC GGTTCACGAG 
CAGGGGCGTT GCGACTGGAC GCTGTACCTG CCGGAAGATC ACTGGGTGAA TATCTGGACC 
GGTGAAGTTC ACCACGGCGG TGAAATTACC GTGGATGCGC CCATTGGCAA GCCGCCGGTC 
TTCTATCGCG CGAAGAGCGA GTGGGCTTCA CTTTTTGCTT CTTTACGGAA TATCTAA

Protein sequence

MSTQSKHLSS VLIEKNIEGF TLTYHQRLIL RHSAETPCLW IGAGVADIDM FRGNFSIKDK 
LNEKIALTEA TISELPDGWL VQFSRGATIS ATLRISTDEA GRLQLDLQND DLHHNRIWLR 
LAANPDDHIY GCGEQFSYFD LRGKPFPLWT SEQGVGRNKT SYVTWQADCK ENSGGDYYWT 
FFPQPTFVST QKYYCHVDNS CYMNFDFSAP EYHELALWED KTTLRFECAD TYIALLEKLT 
ALLGRQPELP DWVYDGVTLG IQGGTEVCQQ KLDTMRNAGV KVNGIWAQDW SGIRMTSFGK 
RVMWNWKWNS DNYPQLDSRI KQWKEEGVQF LSYINPYVAS DKDLCAEAAK HGYLAKDATG 
GDYLVEFGEF YGGVVDLTNP EAYDWFKDVI KKNMIALGCS GWMADFGEYL PTDTYLHNGV 
SAEIMHNAWP ALWAKCNYEA LQETGKLGEI LFFMRAGYTG SQKYSTMMWA GDQNVDWSLD 
DGLASVVPAA LSLAMTGHGL HHSDIGGYTT LFDMKRSKEL LLRWCDFSAF TPMMRTHEGN 
RPGDNWQFDG DAETIAHFAR MTTVFTTLKP YLKQAVAQNA ATGLPVMRPL FLHYENDAAT 
YTLKYQYLLG QDLLVAPVHE QGRCDWTLYL PEDHWVNIWT GEVHHGGEIT VDAPIGKPPV 
FYRAKSEWAS LFASLRNI