Gene SeD_A4159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4159
Symbol
ID	6874148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4005449
End bp	4006390
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	50%
IMG OID	642787096
Product	hypothetical protein
Protein accession	YP_002217722
Protein GI	198243285
COG category	[S] Function unknown
COG ID	[COG5464] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01784] conserved hypothetical protein (putative transposase or invertase)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.241117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.413105
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA GCCCCACGTC CACGCCTCAT GATGCGGTAT TCAAAACGTT TTTACGCCAT 
CCGGATACCG CGCGGGATTT TCTCAATATT CATCTTCCCC ATTCGCTAAG AATACGTTGC 
GATCTGACGA CGTTGAAACT GGCGCCGGAC AGTTTTATCG AGAAAAATTT ACGCGCGTTT 
TATTCCGATG TCCTTTGGTC ACTAAAAACG TGTGAAGGCG ACGGTTATAT CTATGTCGTT 
ATAGAGCATC AGAGTACGCC GGACGCGCAT ATGGCGTTCC GGTTAATGCG TTACGCGACT 
GCCGCGATGC AGCGCCATCT GGATGCTGGC CATAAAACGT TACCGCTGGT GATTCCCATG 
CTGTTTTACC ATGGCGCGAA AAGCCCGTAT CCCTTTTCGC TGTGCTGGCT GGATGAGTTT 
GACGATCCTG CACTGGCGCG TCAGCTTTAT GCGACGGCAT TTCCACTGGT AGACATTACG 
GTGGTGCCGG ATAACGAGAT TATGCAGCAT CGACGTATCG CGATGCTGGA GCTGGTACAA 
AAGCATATAC GTCAACGCGA CCTGATGGGA TTGGTCGAGC GCTTAGCGGT ACTTCTGATT 
ACGGGAAACG CTAATGACAG TCAGCTAAAA GCGCTGTTTA ATTATTTGCT AATACAGCAT 
GGCAGCACGC CTCGTTTTGG CAAGTTTATC CGCGAGGTGG CGCGTCGTGT TCCCCAACAC 
AAGGAGAGAT TAATGACGAT CGTAGACAGA ATACGTGAAT CGGGGCGCAG AAAAGGTAAG 
CGTGAAGGCG TGCAACAAGG CATACAGCAA GGTATACATC AAGGTAAGCA GGAGGAAGCC 
TTGCGTATTG CGCATACGAT GCTGGAACAG GGGATCGAGC GAGAGATGGT GCTGATGATT 
ACCGGGCTTT CTGACGAAGA GATTAAGGCA AAGCGCCATT AA

Protein sequence

MKKSPTSTPH DAVFKTFLRH PDTARDFLNI HLPHSLRIRC DLTTLKLAPD SFIEKNLRAF 
YSDVLWSLKT CEGDGYIYVV IEHQSTPDAH MAFRLMRYAT AAMQRHLDAG HKTLPLVIPM 
LFYHGAKSPY PFSLCWLDEF DDPALARQLY ATAFPLVDIT VVPDNEIMQH RRIAMLELVQ 
KHIRQRDLMG LVERLAVLLI TGNANDSQLK ALFNYLLIQH GSTPRFGKFI REVARRVPQH 
KERLMTIVDR IRESGRRKGK REGVQQGIQQ GIHQGKQEEA LRIAHTMLEQ GIEREMVLMI 
TGLSDEEIKA KRH