Gene SeHA_C0271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0271
Symbol
ID	6490109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	281916
End bp	283679
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	56%
IMG OID	642740549
Product	endochitinase
Protein accession	YP_002044223
Protein GI	194451487
COG category	[R] General function prediction only
COG ID	[COG3979] Uncharacterized protein contain chitin-binding domain type 3
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.527688
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	0.775272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATTGC AAAAAACACT GGCGCTCAGC GCCGTGGCGG CAGGAATCAT GTTGAGCTTA 
TCCGGTGCGC AGGCCGCGCC GCTGCTTAGC AGTAGTGAGC CAATGACCAT CAACGCCAGC 
GATCTGGCGG CGAAAGAGAA AGCGCTGACG GATTTTCCGT TAATGGAGGC CGTGAAATCC 
TCTATCCAGA CGTTGGATAA CAGCGCGGTC GAACAAATCG AACCGGGGCG CGCCGCTAAC 
CCGGCAAACG TAAAACGCGT TGAAAGTATT CTGAAAGAGG CCGACTGGGA TTATCTGTTC 
CCGATGCGCG CGCCGGAATA CACTTACTCT AACTTCCTGA AAGCGATAGG TAAATTCCCG 
GCGGTTTGTG GTACCTACAC CGATGGACGC GATAGCGACG CTATCTGCCG TAAAACCCTG 
GCTACTATGT TTGCGCATTT TGCCCAGGAG ACGGGCGGTC ACGAAAGCTG GCGTGACATT 
CCGGAATGGC GTCAGGCGCT GGTCTATCTG CGCGAAGTCG GCTGGACTGA AGGGCAGAAA 
GGCGGCTACA ACGGCGAATG TAACCCGGAT GTATGGCAGG GCCAGACCTG GCCGTGCGGT 
AAAGATAAGG ACGGCGATTT CCTCAGCTAT TTTGGTCGCG GGGCAAAACA GCTTTCTTAT 
AACTACAACT ATGGGCCTTT CTCTGACGCG ATGTATGGCG ACGTTCGCCC TCTGCTGGAT 
AAACCCGAGC TGGTGGCGGA TACCTGGATG AACCTGGCGA GCGCCGTCTT CTTCTTTGTG 
TATCCGCAGC CGCCGAAGCC GTCTATGCTA CATGTGATTG ACGGTACCTG GCAGCCAAAC 
GATCGCGATA AAGCAAACGG CCTGGTATCA GGTTTCGGCG TCACCATTCA GATCATCAAT 
GGCGGCGTGG AGTGCGGCGG CGCAGATGAG AATGCGCAGT CGCTTAACCG TATCGCCTAC 
TACAAAGAGT TTGCCAACTA CCTGAAAGTG CCGGTGCCGG CTGACGAAGT GTTGGGCTGT 
AAAAAGATGA AGCAGTTCGA TGAAGGCGGC GCTGGCGCGT TACCGATCTA TTGGGAACAA 
GACTGGGGCT GGAGCGCCGA TACTGCGGAC GGTAAAACCT ATTCCTGCCA GTTAGTGGGA 
TATCAGACGC CGTATACCGC CTTTAAAGAG GGCGACTACA CGAAATGTGT ACAGCATTAT 
TTCAACGTTA ATGTCGTCGA TGATAGCGGA ACCACTGAAC CGGATGTCAC GCCAACTCCG 
GCGCCAGTGA CGGATGAAAA CGTGGCGCCA GTCGCGCGCA TTGCCGGACC GGTCGGGGCG 
GTGGAAGCCG GTAGCCCGGT TTCACTCAGC GCGGAAGGAT CGACCGACGC GAATGGCGAC 
AAGCTCACCT ATACCTGGAT GTCGCAGGAT GGCAAAACGC TGAGCGGCCA GGATAAAGCC 
GTTGTGATTT TCAACGCGCC GGATGTCACT CAGAACACCC AGTATGTGGT GAATCTGACC 
GTTAGCGACG GTACGCTCTC CAGTACAGCG GTTTATACGC TGAATGTGAA AGCGAAGGCC 
GCCGCTGCGG ATGACGAAGA TAAGACCACC AGCTATCCTG CCTGGAGCAG CAGCCAGAAA 
TGGAATCCGG GCGACATCGT CAACAGTAAT GGCGCATTGT ACCAGTGCAA ACCGTTCCCG 
GAAGGCTCAT GGTGTAATGT TGCGCCTGCC TACTATGAGC CCGGCGTAGG GATTGCCTGG 
GCCGATGCAT GGAACGCATT GTAA

Protein sequence

MGLQKTLALS AVAAGIMLSL SGAQAAPLLS SSEPMTINAS DLAAKEKALT DFPLMEAVKS 
SIQTLDNSAV EQIEPGRAAN PANVKRVESI LKEADWDYLF PMRAPEYTYS NFLKAIGKFP 
AVCGTYTDGR DSDAICRKTL ATMFAHFAQE TGGHESWRDI PEWRQALVYL REVGWTEGQK 
GGYNGECNPD VWQGQTWPCG KDKDGDFLSY FGRGAKQLSY NYNYGPFSDA MYGDVRPLLD 
KPELVADTWM NLASAVFFFV YPQPPKPSML HVIDGTWQPN DRDKANGLVS GFGVTIQIIN 
GGVECGGADE NAQSLNRIAY YKEFANYLKV PVPADEVLGC KKMKQFDEGG AGALPIYWEQ 
DWGWSADTAD GKTYSCQLVG YQTPYTAFKE GDYTKCVQHY FNVNVVDDSG TTEPDVTPTP 
APVTDENVAP VARIAGPVGA VEAGSPVSLS AEGSTDANGD KLTYTWMSQD GKTLSGQDKA 
VVIFNAPDVT QNTQYVVNLT VSDGTLSSTA VYTLNVKAKA AAADDEDKTT SYPAWSSSQK 
WNPGDIVNSN GALYQCKPFP EGSWCNVAPA YYEPGVGIAW ADAWNAL