Gene SeD_A4871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4871
Symbol
ID	6871833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4722215
End bp	4723234
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	56%
IMG OID	642787755
Product	hypothetical protein
Protein accession	YP_002218349
Protein GI	198242573
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0380128
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATAA TAAAAAGCTA CGCCGCCAAA GAGGCGGGCG GCGAACTCGA ACTCTATGAA 
TATGACGCGG GAGAACTCCA ACCGGAAGAT GTCGAGGTAC GGGTCGACTA CTGCGGGATC 
TGCCATTCCG ATCTGTCAAT GATCGACAAT GAATGGGGGT TCTCTCAATA CCCTCTGGTT 
GCCGGACATG AGGTCATCGG TCGGGTGGCC GCACTCGGTA GCGCGGCACA GGATAAGGGA 
CTAAAAGTCG GCCAGCGCGT TGGAATCGGC TGGACGGCGC GCAGCTGCGG ACACTGCGAT 
GCCTGTATCA GCGGCAATCA AATTAACTGC CTGGAAGGGG CAGTGCCCAC TATCCTCAAT 
CGTGGCGGTT TTGCCGAGAA GCTTCGCGCG GGCTGGCAGT GGGTAATTCC TCTTCCGGAG 
AATATGGATA TGGCGTCCGC AGGCCCGCTG TTATGTGGCG GCATTACGGT CTTTAAACCG 
CTACTGATGC ACCATATTAC TGCTACCAGC CGCGTTGGCG TCATCGGTAT TGGCGGGCTT 
GGGCATATCG CCATAAAGCT GTTACATGCA ATGGGCTGCG AAGTCACCGC GTTCAGCTCC 
AATCCATCGA AAGAGCAGGA AGTGCTGGCG ATGGGTGCCA ATAACGTGGT GAACAGCCGC 
GATCCGGAAG CGTTAAAAGC ACTGGCGGGC CAGTTCGATC TCATTATTAA CACGGTCAAC 
GTCGATCTCG ACTGGCAGCC CTACTTCGAA GCGCTGACGT ATGGCGGCAA CTTCCATACC 
GTTGGGGCCG TATTGAAGCC GCTGCCCGTA CCGGCGTTTA CATTAATTGC CGGCGATCGC 
AGTATCTCAG GCTCGGCAAC CGGAACGCCA TATGAACTTC GCAAACTGAT GAAATTCGCC 
GGACGCAGCA AAGTCGCGCC CACCACGGAA CTGTTCGCGA TGTCACAAAT CAACGAGGCT 
ATCCAGCACG TTCGCGACGG CAAAGCCCGC TATCGTGTAG TGCTAAAAGC TGACTTCTGA

Protein sequence

MTIIKSYAAK EAGGELELYE YDAGELQPED VEVRVDYCGI CHSDLSMIDN EWGFSQYPLV 
AGHEVIGRVA ALGSAAQDKG LKVGQRVGIG WTARSCGHCD ACISGNQINC LEGAVPTILN 
RGGFAEKLRA GWQWVIPLPE NMDMASAGPL LCGGITVFKP LLMHHITATS RVGVIGIGGL 
GHIAIKLLHA MGCEVTAFSS NPSKEQEVLA MGANNVVNSR DPEALKALAG QFDLIINTVN 
VDLDWQPYFE ALTYGGNFHT VGAVLKPLPV PAFTLIAGDR SISGSATGTP YELRKLMKFA 
GRSKVAPTTE LFAMSQINEA IQHVRDGKAR YRVVLKADF