Gene SeHA_C0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0020
Symbol
ID	6489599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	17868
End bp	19967
Gene Length	2100 bp
Protein Length	699 aa
Translation table	11
GC content	51%
IMG OID	642740314
Product	exochitinase
Protein accession	YP_002043988
Protein GI	194450498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.871167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTACAA GCAAACTGAT TCAAGGCGAT ACAATTACTG AAACTACTCA TGCAGCGAAT 
GGTTTTGACC CTGCAACAAG CGATGATAAA ATAAGCTATA CTTCCGCTCG TGTTGCGAAA 
CCGGTATACA ATAAATATAA AAATTCCACG ACTAAACCGA AGGTATTCGG TTATTACACC 
GACTGGTCAC AGTATGACAG CCGTCTGCAA GGCAATATGT CCCAACCGGG CCGTGGTTAT 
GATTTAACCA AAGTTTCACC GACGGCTTAT GACAAACTGA TTTTTGGCTT TGTTGGCATC 
ACCGGTTTCA GAAAAATTGA TACAGAAGAC CGCGATGTCG TAGCAGAAGC GGCAGCGCTG 
TGCGGCAAAG TGAAATATGA GCCGACCTTC CTCGACCCAT GGGGCGACTT CCAGTCTTAT 
ATCAACCTCG GCTTTGATGT CAGCGGCTGG GATGTGGATC CGAAGACTGT AACTCAGTCT 
AACGCCAAGG GTCTGCTGGG CGCGCTGCGT GATATGCAGG CAAAAGCGAA AGCCGCAGGT 
CACACGCTGG CGCTCTCCAT GAGTATCGGC GGCTGGAGCA TGAGTAACGG GTTCCACGAA 
ACCGCCGCTT CTGACTCTTC TCGTAAAATC TTCGCCAAAG GCGTGGTGAA ACTGTTCAAA 
CAGTTCCCGA TGTTCAGCGA AGTGGATATT GACTGGGAAT ACCCGAACAA TGAAGGGGCG 
GGCAACCCGT TTGGTCCGGA AGATGGCGCT AACTACGCGC TGCTGATTGC CGAACTGCGT 
AAACAGCTGG ATTCCGCTGG TCTGAGCAAT GTGAAGATCT CTATTGCCGC TTCTGCTGTC 
ACTACTATTT TTGACTATGC GAAAGTAAAA GATCTGATGG CTGCCGGCCT GTATGGCATC 
AACCTGATGA CCTATGACTT CTTCGGTACG CCGTGGGCGG AAACGCTGGG CCACCACACC 
AACCGCAAAG CGCTGGAAGA GGGCGGCTGG GCTGTCGAAA CTATCGTTGA TCACCTGCTG 
GCGGAAGGTT TCTCCGCTGA CCGTATCAAC ATCGGTTATG CCGGCTATAC CCGTAACGCT 
CGTCAGGTAG AAATTGAATC CCTGTCGCCG CTGAAAGGTT CTTACAACCC AGGTTCAGGC 
CCTACTACCG GTTCCTTCGA ATCCGGCACC AGCGAATGGT ATGACGTCAT TTATAGCTAC 
CTGGATCTGG AAAACCAGAA AGGCCGTAAC GGTTTCAACG TTTACACCGA CCAGGTCGCT 
GATGCTGACT ACCTGTATAG CCCGGAATCC AAACTGTTTT TATCCCTGGA TACGCCGCGT 
ACTGTCAAAG CAAAAGGCGA ATATGCAGCG AAACTGGGCC TGGGCGGCGT GTTTACCTGG 
ACTATCGATC AGGACAACGG CGTGCTGGTT AACGCCGTGC GTGAAGGTCT GGGTTATGAA 
ATCGAATCTG AAGTTATCGA TATGGAACCG TTCTACTTTG AAGGTATCAA TGTAGAAAAA 
GATGAAGAGC AGAGCGACAG CGACGACGCG CAGAAGGTCA ACCACGCGCC GAAAGCGGCG 
ATTGAACTGA TGGTTGTAGG CGGATCTACG GTACAGCTGT CTGGCGCAGG TTCTTCTGAT 
GAAGATAACG ATGAGTTGTC CTTTAGCTGG GGCGTGCCTT CTCAAATCGA TGTGGCAGAC 
AAAACGGCAG AAATCATTGA GGTTGTGGTA CCGGAAGTTA GCGAAAAAAC AGCCTTTCAG 
TTCACCCTGT TTGTACGCGA CTGCTACAAC GAACCGTCCT CTCAACAGCG CTTTGTTCTG 
ACGGCTGTGC CTGCGCTATC TCAGGTTCAA CCGGAACCGG AAGAGGAAGA AGAGATTATC 
GTTCCTGTAC CGGACGAGGA AGAAGATACC ACGCCGGCTG AGGATGATAC GCCAGCAGAT 
GACAAAACGT CACCTTACGC GCAGTGGGAT GCTTCTACCG TTTATGGCGC AAACTGGGGT 
TCTTTCGAAA TCGTTAGCTG GAAAGGCCAT AACTATCAGG TGAAATGGTG GTCTATGGGC 
AACCAGCCTG ACCTGAACTG CGGTGTCGGC GGTGCATGGA CCGATCTTGG CGCTTACTAA

Protein sequence

MATSKLIQGD TITETTHAAN GFDPATSDDK ISYTSARVAK PVYNKYKNST TKPKVFGYYT 
DWSQYDSRLQ GNMSQPGRGY DLTKVSPTAY DKLIFGFVGI TGFRKIDTED RDVVAEAAAL 
CGKVKYEPTF LDPWGDFQSY INLGFDVSGW DVDPKTVTQS NAKGLLGALR DMQAKAKAAG 
HTLALSMSIG GWSMSNGFHE TAASDSSRKI FAKGVVKLFK QFPMFSEVDI DWEYPNNEGA 
GNPFGPEDGA NYALLIAELR KQLDSAGLSN VKISIAASAV TTIFDYAKVK DLMAAGLYGI 
NLMTYDFFGT PWAETLGHHT NRKALEEGGW AVETIVDHLL AEGFSADRIN IGYAGYTRNA 
RQVEIESLSP LKGSYNPGSG PTTGSFESGT SEWYDVIYSY LDLENQKGRN GFNVYTDQVA 
DADYLYSPES KLFLSLDTPR TVKAKGEYAA KLGLGGVFTW TIDQDNGVLV NAVREGLGYE 
IESEVIDMEP FYFEGINVEK DEEQSDSDDA QKVNHAPKAA IELMVVGGST VQLSGAGSSD 
EDNDELSFSW GVPSQIDVAD KTAEIIEVVV PEVSEKTAFQ FTLFVRDCYN EPSSQQRFVL 
TAVPALSQVQ PEPEEEEEII VPVPDEEEDT TPAEDDTPAD DKTSPYAQWD ASTVYGANWG 
SFEIVSWKGH NYQVKWWSMG NQPDLNCGVG GAWTDLGAY