Gene SeD_A1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1051
Symbol
ID	6874712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1053174
End bp	1054406
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	55%
IMG OID	642784236
Product	hypothetical protein
Protein accession	YP_002214910
Protein GI	198245764
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	0.241147
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTGC CGTACCTTTC TCTTTCCCAG GCCCGTTGTC TTCACCTTGC TGCGCAGGGG 
CTATTGAAAA AGCCGCGCCG TAACGCGCTG CCTGGCGATG TTCTTGCCGC CATCTCACGC 
ATGGCGTTGC TGCAAATTGA TACCATCAAT GTTGTCGCAC GTAGCCCCTA TCTGGTGCTG 
TTTAGCCGTC TCGGTTCGTA CCCGCAGGCC TGGCTGGATG AGGCGCTGCG ACGCGGCGAG 
TTAATGGAAT ACTGGGCGCA TGAGGCCTGT TTCTTACCAC GCCGCGACTT TAAACTTATC 
CGCCATCGTA TGCTGTCGCC GGAAAAGATG GGCTGGAAAT ATCGCGCGGC ATGGATGCAT 
GAGCACGCGG AAGAAATAGA ACAGCTAATG CGGCATATTC AGGAGCACGG CCCGGTGCGA 
TCTGCCGATT TTGAACATGC GCAGAAAGGC GCCAGCGGCT GGTGGGAATG GAAACCACAT 
AAACGCCACC TTGAGGGTTT ATTTACCGCC GGAAAAGTCA TGGTTGTTGA GCGGCGTAAT 
TTTCAACGTG TATATGATTT AACGCGCCGT GTGATGCCGC ACTGGGATGA TGAACGCGAT 
GGACTGTCAC AGCCGCAGGC GGAAAGCCTG ATGCTGGATA ATAGCGCGCG CAGTCTGGGG 
ATTTTCCGTG AACAGTGGCT GGCGGATTAC TACCGCCTGA AACGTCCTGA CCTGAAAGGA 
TGGCGGGAGA GCCGGGCGGA ACAGCAGCAG ATTATTCCGG TCGAGGTGGA AACGTTGGGG 
CGGATGTGGC TTCATGCCGA TCTTCTTTCG CAGCTTGAAC CGGCGCTAAA TAACGCCTTA 
AAGGCGACCC ATAGCGCAGT GCTGTCGCCT TTCGATCCTG TGATATGGGA TCGCAAGCGG 
GCAGCGCAGC TTTTCGGATT TAACTATCGG CTGGAATGTT ATACGCCTGC GGCGAAGCGC 
CAGTACGGTT ATTTTGTGCT GCCGCTATTA TACCAGGGCC GTTTAGTCGG GCGAATGGAC 
GCCAAAATGC ACCGTAAAAC GGGGGTACTT GAGGTTATCT CGCTGTATCT GGAGGACGAT 
ATTCGCCCTG GCGTTAGTCT GCAAAAAGGA ATCTGGCAGG CCATTAGCGC GTTTGCTGCC 
TGGCAACGGG CATCGCGCGT GACGCTGGGA CAATGTCCGC CAGGCCTGTT TAGCGCCATG 
CGTCATGGCT GGGAAATAGA CCCTGCACCA TAA

Protein sequence

MSLPYLSLSQ ARCLHLAAQG LLKKPRRNAL PGDVLAAISR MALLQIDTIN VVARSPYLVL 
FSRLGSYPQA WLDEALRRGE LMEYWAHEAC FLPRRDFKLI RHRMLSPEKM GWKYRAAWMH 
EHAEEIEQLM RHIQEHGPVR SADFEHAQKG ASGWWEWKPH KRHLEGLFTA GKVMVVERRN 
FQRVYDLTRR VMPHWDDERD GLSQPQAESL MLDNSARSLG IFREQWLADY YRLKRPDLKG 
WRESRAEQQQ IIPVEVETLG RMWLHADLLS QLEPALNNAL KATHSAVLSP FDPVIWDRKR 
AAQLFGFNYR LECYTPAAKR QYGYFVLPLL YQGRLVGRMD AKMHRKTGVL EVISLYLEDD 
IRPGVSLQKG IWQAISAFAA WQRASRVTLG QCPPGLFSAM RHGWEIDPAP