Gene SeD_A1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1803
Symbol
ID	6873086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1749292
End bp	1750353
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	50%
IMG OID	642784938
Product	hydrogenase-1 operon protein HyaF2
Protein accession	YP_002215606
Protein GI	198245218
COG category	[C] Energy production and conversion
COG ID	[COG1773] Rubredoxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.080124
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATTATT CCAGAACTAT TCCAGTCGTT AATATTGCCG GACCAGGCTC GCAGCCAGAA 
GAGGAAGACT TTAACTTTCT TCCTATCCCC GCCGGCATTA ATCTCCCGCT GACGCCGGTT 
TTACCGGAAC AGGCGCTGCC CGCTGAGCTC CGTGTTGCCA GACACATCCT GACTACGCTT 
ATTCGCGATA TGGATAACCC AGTGGCAACG CTCCCCTTTC CCCTGAGCTA TAAGCTGAAT 
GCCACTGAGC AACAGAATAG CGGTTTATTG GATCAACTGC TCGGCGAAGG TGAAATCTCC 
GCCCGGGTAC TATTATCCGA TGGAAAAGAA CAGCGTATTC AGGAGACGGT TTTTACGGGC 
GTCTGGCGTG TGCGTGAATA TAACGCTGAC CAGCAACGGG TTGCCGATGA AATTATCATT 
GGCCCGATCC CAGAGAGCAT CTGGCAGACG CATCCGCAGC CGCCGATTAC GCCAGAATTG 
CCGCCACAAC CGGCGGGATT GATGAATGGT GCCTTTATCG CGCATGAAAT AGCCGAGCGC 
GTAAAACAGC CGGTAAAAGA GCCGCATATC ATTAACTTAA CGCTGTTGCC AGTAAACGAT 
GCCGATCGCG AGTATCTGGA TCATTTTTTA GGCGAAGGTT GTAGCGCTAT TTTTTCACGC 
GGATATGGTA AATGCCGGAT TGTAAGCACG CATTTTCCCG GCGTATGGCG GGTCAATTAT 
TTCAATGATA TGAACACATT ACTGCAAGAT ATGATTGAGA TAGCGGACAT TCCTGATATC 
GCCGTTGCAG GCATCGATGA TATCGAAGAT GCCTACGCGG GGCTAAAAAA TACGTTGGAA 
TGGTTGAAAG AATACCCGGT TACAGAAAAT GAGCCAGTGG TGCGCATGGA GTGCAAAGTA 
TGTTGGTGGG TTTACGACCC TGCGCTGGGC GATGACGTAT GGCAAATTCC ACCCGGTGTG 
CCCTTCAGCC AGTTACCTGA TTACTGGTGC TGTCCGGTTT GCGAAACCAG TAAGTCCGGG 
TTTATGGTGA TCGATGAAGG TAATAGTTCG TGCAAAGATT GA

Protein sequence

MNYSRTIPVV NIAGPGSQPE EEDFNFLPIP AGINLPLTPV LPEQALPAEL RVARHILTTL 
IRDMDNPVAT LPFPLSYKLN ATEQQNSGLL DQLLGEGEIS ARVLLSDGKE QRIQETVFTG 
VWRVREYNAD QQRVADEIII GPIPESIWQT HPQPPITPEL PPQPAGLMNG AFIAHEIAER 
VKQPVKEPHI INLTLLPVND ADREYLDHFL GEGCSAIFSR GYGKCRIVST HFPGVWRVNY 
FNDMNTLLQD MIEIADIPDI AVAGIDDIED AYAGLKNTLE WLKEYPVTEN EPVVRMECKV 
CWWVYDPALG DDVWQIPPGV PFSQLPDYWC CPVCETSKSG FMVIDEGNSS CKD