Gene SeHA_C4035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4035
Symbol	rfaD
ID	6489904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3918326
End bp	3919258
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	51%
IMG OID	642744136
Product	ADP-L-glycero-D-mannoheptose-6-epimerase
Protein accession	YP_002047741
Protein GI	194451499
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCATCG TTACCGGCGG CGCGGGCTTT ATCGGCAGCA ATATCGTTAA GGCCCTGAAT 
GATAAAGGTA TCACCGATAT TCTGGTGGTG GATAACCTGA AAGACGGCAC CAAGTTTGTA 
AACCTGGTGG ATCTGAACAT TGCTGACTAT ATGGATAAGG AAGATTTCCT GATCCAGATT 
ATGTCCGGAG AAGAGCTCGG CGATATCGAA GCTATTTTCC ATGAAGGCGC CTGCTCTTCC 
ACCACCGAGT GGGACGGCAA GTATATGATG GATAATAACT ATCAATACTC CAAAGAGCTG 
CTGCACTATT GTCTTGAGCG CGAAATCCCG TTCCTCTACG CCTCTTCTGC CGCCACCTAT 
GGCGGTCGCA CGTCTGATTT CATCGAATCG CGCGAATACG AAAAACCGCT TAACGTTTAT 
GGCTATTCTA AATTCCTGTT TGATGAATAT GTGCGCCAGA TCCTGCCAGA AGCGAACTCG 
CAGATTGTCG GTTTCCGCTA TTTCAACGTC TATGGACCAC GTGAAGGCCA TAAAGGCAGC 
ATGGCAAGCG TGGCATTTCA TCTGAATACA CAGTTAAACA ACGGCGAAAG CCCGAAACTG 
TTTGAAGGCA GCGAAAACTT CAAGCGCGAC TTCGTTTACG TGGGCGATGT GGCCGCCGTT 
AACCTGTGGT TCCTGGAAAG CGGCAAGTCC GGCATCTTTA ACCTGGGCAC AGGCCGTGCG 
GAATCTTTCC AGGCCGTCGC CGACGCGACG CTGGCATACC ATAAAAAAGG TAGCATTGAA 
TACATTCCGT TCCCGGATAA GCTGAAAGGT CGCTATCAGG CGTTTACGCA GGCGGATTTA 
ACCAATCTGC GCAACGCGGG CTACGACAAA CCCTTTAAGA CCGTCGCCGA AGGCGTCACG 
GAGTATATGG CCTGGCTGAA CCGCGACGCG TAA

Protein sequence

MIIVTGGAGF IGSNIVKALN DKGITDILVV DNLKDGTKFV NLVDLNIADY MDKEDFLIQI 
MSGEELGDIE AIFHEGACSS TTEWDGKYMM DNNYQYSKEL LHYCLEREIP FLYASSAATY 
GGRTSDFIES REYEKPLNVY GYSKFLFDEY VRQILPEANS QIVGFRYFNV YGPREGHKGS 
MASVAFHLNT QLNNGESPKL FEGSENFKRD FVYVGDVAAV NLWFLESGKS GIFNLGTGRA 
ESFQAVADAT LAYHKKGSIE YIPFPDKLKG RYQAFTQADL TNLRNAGYDK PFKTVAEGVT 
EYMAWLNRDA