Gene SeD_A3048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3048
Symbol
ID	6873376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2939570
End bp	2940628
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	56%
IMG OID	642786078
Product	phage major capsid protein, P2 family
Protein accession	YP_002216724
Protein GI	198245755
COG category
COG ID
TIGRFAM ID	[TIGR01551] phage major capsid protein, P2 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.000831709
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAGA ATACCCGCTT TGCTTTTAAC GCTTACCTGC AGCAGCTGGC GCGTCTGAAC 
GGTGTGGCCG TTGAAGAACT GTCCAGCAAG TTCACTGTAG AGCCGTCTGT GCAGCAGACG 
CTGGAAGACC AGATCCAGCA GTCCGCCGCA TTCCTGACGC TGATTAACGT CACGCCAGTG 
ACTGAGCAGT CCGGTCAGCT GCTGGGGCTG GGTGTTGGCA GCACCATTGC CGGAACCACT 
GACACCACTG CGAAAGAGCG TGAACCTGTC GATCCGACGC TGATGGTCGA TGTGGAATAT 
AAATGCGAGC AGACCAACTT TGACACGGTG CTGACCTACG CGAAGCTGGA CCTGTGGGCG 
AAGTTTCAGG ATTTCCAGGT GCGTATCCGT GACGCCATCG TGAAACGTCA GGCACTGGAC 
CGCATCATGA TCGGCTTTAA CGGCGTGAAG CGTGCGAAAA CCTCCAACCG TAGTGAAAAC 
CCGCTGCTGC AGGATGTGAA TAAAGGCTGG CTGCAGAAAA TCCGTGAGGA TGCACCGGAT 
CACGTCATGG GCAGCACCAC CGCGGGCGGC GAAACCACAC CGGGTGCGGT GAAAGTCGGG 
AAAGGTGGCG AATATGCCAA CCTGGACGCT GTGGTGATGG ATGCGGTCAA TGAGCTTATC 
GACGTGGTCT ACCAGGACGA TGACGATCTG GTGGTGATTT GCGGTCGTGA ACTGCTGTCT 
GACAAGTATT TCCCGCTGGT CAACAAAGAG CAGGAAAACA GTGAAAAATT GGCAGCCGAT 
ATGATTATCA GTCAGAAACG CATGGGCGGT CTGCAGGCCG TGCGTGCGCC GTTCTTCCCG 
CCGAATGCGC TGCTGATCAC CCGTCTGGAT AACTTGTCCA TCTACTGGCA GGAAGACACC 
CGCCGCCGTT CAGTTATCGA CAACCCGAAA CGTGACCGGA TTGAAAATTT TGAATCCGTT 
AACGAAGCCT ACGTGGTTGA GGACTACCGC TGCGCCGCAC TGGTGGAAAA CCTCCAGATT 
GGCGACTTCA GCGCCGCCGC AGCAGAAGCC GGAGCGTAA

Protein sequence

MKKNTRFAFN AYLQQLARLN GVAVEELSSK FTVEPSVQQT LEDQIQQSAA FLTLINVTPV 
TEQSGQLLGL GVGSTIAGTT DTTAKEREPV DPTLMVDVEY KCEQTNFDTV LTYAKLDLWA 
KFQDFQVRIR DAIVKRQALD RIMIGFNGVK RAKTSNRSEN PLLQDVNKGW LQKIREDAPD 
HVMGSTTAGG ETTPGAVKVG KGGEYANLDA VVMDAVNELI DVVYQDDDDL VVICGRELLS 
DKYFPLVNKE QENSEKLAAD MIISQKRMGG LQAVRAPFFP PNALLITRLD NLSIYWQEDT 
RRRSVIDNPK RDRIENFESV NEAYVVEDYR CAALVENLQI GDFSAAAAEA GA