Gene SeHA_C4546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4546
Symbol
ID	6492385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4424289
End bp	4425332
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	642744618
Product	gp47
Protein accession	YP_002048195
Protein GI	194450026
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	0.494674
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAGA TAACGGTATC CGGCGGGGTG TTCGCCACCC TGACGCCCAT TTTTACCCTT 
TGGTACGGAC ATAAAGAGAT CACTTACGAC ATCGCGCCTT ATGTCACCAG CATCAGTTAC 
AGCGACAGTA TTAAAAACGA GTCGGATGTC ATTGCCATTG CGCTGGAAGA TAGCACCGGG 
CGCTGGGTAA ACGAATGGTA TCCGGGAAAA GGCGACACGC TGGCGCTGCG CCTGGGCTAC 
CAGGGCGAAG ATCTGCTCGA TTGCGGAATC TATGTCATTG ATAAAATTGA TATCAGCGCG 
CCGCCTTCGA CGGTCAATAT CGACGGTATC GCCACCTCGG TCAGCAAAGC GCTACGCACC 
AAAAACAGCC AGGGCTTTGA GGAGACTACG CTTTCCGCCA TCGCCAGTCG CATCGCGCAA 
AAACACGGTT TAACGCTGGC GGGCAAGATT GCGCCGCTGA CGATTGATCG GGTCACGCAA 
TATGCCGAAA CCGATGTAGC GTTTCTCAAA CGGCTGGCGA GTGAATATGG CTATACCGTG 
AAAGTGACGG CGACGGAGCT GATCTTTTCG CATCTGCCGA CGCTGCGCTG TCTGGCGCCG 
GTGAAGACGC TCAGGCGGAC GGATGTTTCG CACTACACGT TCAAAGATAC CATCAACCGG 
ATCTACAAAA ACGCCACCGT GCAGCATCAA AATAGCAAGC AAAAAGAACT GGTTATTTAT 
ACCCATGATA GCCAGGAAAA GACCTCGGCG CGCGGTGCGG CGACCAGCGC CGATACCCTG 
AAGATCAACA GTCGCGCTCC GGATACCGGC GCGGCGCAGG CTAAAGCCAA TGCCGCGCTG 
GACAGCCACA ACGAATACCA GCAGACCGGC ACGCTCAGCT TGATGGGCTG CCCGCAGTTG 
ACGGCGGGCA ACAAGATAGA ACTGAGCGAT TTTGGCGTAC TTTCCGGGCA GTGGCTGATT 
GATAAATCCA TGCACAAACT CACGCGCAGC GGCGGCTACA CTACCGAAAT CGACATTTCA 
CGCGGACCGG CAACCAGCCA GTAA

Protein sequence

MAEITVSGGV FATLTPIFTL WYGHKEITYD IAPYVTSISY SDSIKNESDV IAIALEDSTG 
RWVNEWYPGK GDTLALRLGY QGEDLLDCGI YVIDKIDISA PPSTVNIDGI ATSVSKALRT 
KNSQGFEETT LSAIASRIAQ KHGLTLAGKI APLTIDRVTQ YAETDVAFLK RLASEYGYTV 
KVTATELIFS HLPTLRCLAP VKTLRRTDVS HYTFKDTINR IYKNATVQHQ NSKQKELVIY 
THDSQEKTSA RGAATSADTL KINSRAPDTG AAQAKANAAL DSHNEYQQTG TLSLMGCPQL 
TAGNKIELSD FGVLSGQWLI DKSMHKLTRS GGYTTEIDIS RGPATSQ