Gene SNSL254_A4547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4547
Symbol
ID	6483870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4419506
End bp	4420549
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	55%
IMG OID	642739773
Product	gp47
Protein accession	YP_002043455
Protein GI	194445565
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.92987
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAGA TAACGGTATC CGGCGGGGTG TTCGCTACCC TGACGCCCAT TTTTACCCTT 
TGGTACGGAC ATAAAGAGAT CACTTACGAC ATCGCGCCTT ACGTCACCAG CATCAGTTAC 
AGTGACAGCA TTAAAAACGA GTCGGATGTT ATTGCCATTG CGCTGGAAGA TAGCGCCGGG 
CGCTGGGTAA ACGAATGGTA TCCGGGAAAA GGCGACACGC TGGCGCTGCG CCTGGGCTAC 
CAGGGCGAAG AGCTGCTCGA TTGCGGAATC TATGTCATTG ATAAAATTGA TATCAGCGCG 
CCGCCTTCGA CGGTCAATAT CGACGGTATC GCCACCTCGG TCAGCAAAGC GCTACGCACC 
AAAAACAGCC AGGGCTTTGA GGAGACGACG CTTTACGCCA TCGCCAGTCG CATCGCGCAA 
AAACACGGTT TAACGCTGGT GGGCAAGATT GCGCCGCTGA CGATTGATCG GGTCACGCAA 
TATGCCGAAA CCGATGTGGC GTTTCTCAAA CGGCTGGCGA GTGAATATGG CTATACCGTG 
AAAGTGACGG CGACGGAGCT GATCTTTTCG CATCTGCCGA CGCTGCGCTG TCTGGCGCCG 
GTGAAGACGC TCAGGCGGAC GGATATTTCG CACTACACGT TCAAAGATAC CATCAACCGG 
ATCTACAAAA ACGCCACCGT GCAGCATCAA AATAGTAAGC AAAAAGAACT GGTTATTTAT 
ACCCATGATA GCCAGGAAAA GACCTCGGCG CGCGGTGCGG CGACCAGCGC CGATACCCTG 
AAGATTAACA GTCGCGCTCC GGATACCGGC GCGGCGCAGG CTAAAGCCAA TGCCGCGCTG 
GACAGCCACA ACGAATACCA GCAAACCGGC ACGCTCACCC TGATGGGCTG CCCGCAGTTG 
ACGGCGGGCA ACAAGATAGA ACTGAGCGAT TTTGGCGTAC TTTCCGGGCA GTGGCTGATT 
GATAAATCCA TGCACAAACT CACGCGCAGC GGCGGCTACA CTACCGAAAT CGACATTTCA 
CGCGGACCGG CAACCAGCCA GTAA

Protein sequence

MAEITVSGGV FATLTPIFTL WYGHKEITYD IAPYVTSISY SDSIKNESDV IAIALEDSAG 
RWVNEWYPGK GDTLALRLGY QGEELLDCGI YVIDKIDISA PPSTVNIDGI ATSVSKALRT 
KNSQGFEETT LYAIASRIAQ KHGLTLVGKI APLTIDRVTQ YAETDVAFLK RLASEYGYTV 
KVTATELIFS HLPTLRCLAP VKTLRRTDIS HYTFKDTINR IYKNATVQHQ NSKQKELVIY 
THDSQEKTSA RGAATSADTL KINSRAPDTG AAQAKANAAL DSHNEYQQTG TLTLMGCPQL 
TAGNKIELSD FGVLSGQWLI DKSMHKLTRS GGYTTEIDIS RGPATSQ