Gene SeD_A2251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2251
Symbol
ID	6875062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2151528
End bp	2152607
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	55%
IMG OID	642785352
Product	tail protein
Protein accession	YP_002216014
Protein GI	198246233
COG category	[S] Function unknown
COG ID	[COG3299] Uncharacterized homolog of phage Mu protein gp47
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.00492829
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGACA GTCAATTTGC ACGTCCTGAA CTTCCTCAGT TGATTGCTAC CATTCGCAGC 
GATTTACTGA CCCGTTTTCA GCAGGATGTT GTGTTACGTC GCATGGATGC CGAGGTTTAC 
AGCCGGGTAC AGGCTGCTGC CGTACATACG CTGTATGGTT ATATCGATTA TCTGGCCCGG 
AATATGCTGC CTGATATGTG TGATGAGGAC TGGCTTTACC GTCACGCGAG GATTAAGCGT 
TGTCCCAGGA AAAATGCCGT ATCTGCGAAG GGATTTGCAC GCTGGGATGG TATTGCCGGA 
ACGCCGGAGA TCCCCGCGGG TACACAGATT CAGCGGGATG ATCAGGTTAC ATTCACGACC 
CTGCAGACGG TGAAAGCTTC CGGCGGCCTG TTACGTGTGC CGGTTATTGC TGATGTGGCG 
GGAACTGCCG GTAATACTGA CGATGGTACG GCGTTACGCC TTGGCACGCC GATTACTGGT 
ATTCCTTCTA CAGGTTACGC TGACACTCTG ACCGGGGGGG CTGATACAGA GGAGCCTGAA 
ACGTGGCGCG CGCGCGTCAT GGAACGCTAT TACTGGATAC CACAGGGGGG CGCTGATCCT 
GATTACGTCA TCTGGGCAAA GGAAATCGCG GGAATAACCC GTGCGTGGAC ATTCCGCCAT 
TATAAGGGGA CCGGCACCGT TGGTGTGATG GTGGCTACCA GTAACCCGGT GAATCCGGCT 
CCTGGCGACG ATCTCGTTAA GGCTGTACGT GACCATATTT TGCCGCTGGC ACCTGTTGCT 
GGCGGCGGAC TCTTTGTTTT CGCTGCCACT GAAAAAAGCA TTCCGGTAAC AGTCGCACTG 
GCCAAAGATA CCCCGGAAAT TCGTACTGCC ATTATTGCGG AGCTAAATGC GCTGATGCTG 
CGTGATGGCG CGCCGTCCGG AAAAATTTAT GTTTCGCGAA TCAGCGAGGC GATAAGTCTG 
GCGACCGGGG AAGTGGCACA TCAGCTGCGT GTGCCGGCGG CAGATGTGGT GCTGGGAAAA 
ACTGAACTTC CTGTCCTGGG GAATATAACC TGGGCCACCT ATACCGGGGA GAACGGATAA

Protein sequence

MADSQFARPE LPQLIATIRS DLLTRFQQDV VLRRMDAEVY SRVQAAAVHT LYGYIDYLAR 
NMLPDMCDED WLYRHARIKR CPRKNAVSAK GFARWDGIAG TPEIPAGTQI QRDDQVTFTT 
LQTVKASGGL LRVPVIADVA GTAGNTDDGT ALRLGTPITG IPSTGYADTL TGGADTEEPE 
TWRARVMERY YWIPQGGADP DYVIWAKEIA GITRAWTFRH YKGTGTVGVM VATSNPVNPA 
PGDDLVKAVR DHILPLAPVA GGGLFVFAAT EKSIPVTVAL AKDTPEIRTA IIAELNALML 
RDGAPSGKIY VSRISEAISL ATGEVAHQLR VPAADVVLGK TELPVLGNIT WATYTGENG