Gene SeHA_C4047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4047
Symbol
ID	6492576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3929748
End bp	3930872
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	48%
IMG OID	642744148
Product	lipopolysaccharide core biosynthesis protein RfaG
Protein accession	YP_002047753
Protein GI	194449220
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.40753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGTTG CCTTTTGCTT ATATAAATAT TTTCCTTTTG GCGGTCTGCA GCGTGATTTT 
ATGCGTATTG CTCAAACCGT GGCGGCGCGA GGTCATCAGG TTCGTGTTTA TACTCAGTCA 
TGGGAAGGGG AATGCCCGGA TAACTTTGAA TTAATCCGCG TGCCGGTTAA ATCCCGGACG 
AACCACGGTC GTAACGCAGA ATATTATGCC TGGGTGCAAC ACCATTTGCG CGACCACCCT 
GTCGATCGGG TGGTTGGATT CAATAAGATG CCGGGCCTTG ATGTGTATTA CGCCGCAGAC 
GTGTGTTACG CCGAAAAAGT CGCACAGGAA AAAGGATTTT TCTATCGCCT GACATCACGC 
TATCGGCATT ATGCTGCTTT TGAACGCGCC ACGTTTGAAC ACGGCAAGCC GACGCAACTA 
TTAATGCTGA CGAATAAGCA GATTGCTGAC TTCCAAAAAC ATTATCAGAC TGAAGCGGAG 
CGTTTCCATA TTCTTCCTCC GGGGATTTAC CCGGACAGAA AATATAGCCA ACAGATCCCA 
AACAGTCGTC AAATTTATCG TCAGAAAAAT GGTATCTCAG AACAGCAAAA ATTACTGTTG 
CAAGTAGGGT CTGACTTTAC CCGTAAAGGT GTGGATCGCT CTATTGAAGC GCTGGCATCG 
CTACCCGAAT CTTTACGGCA AAATACGGTG CTCTATGTTG TCGGGCAGGA TAAGCCGAAG 
AAGTTTGCAG CACTGGCTGA AAGAAGCGGC GTCGGCACGA ATGTGCATTT TTTCTCCGGA 
CGTAATGATA TCGCGGAGTT AATGGCGGCA GCCGACCTTT TACTGCATCC AGCCTATCAG 
GAAGCTGCTG GTATTGTTTT GCTGGAAGCC ATTACTGCTG GTTTGCCGGT GCTGACAACT 
GCGGTGTGCG GTTATGCACA TTATATTGTG GATGCAAACT GTGGCGAAGC GATGACTGAA 
CCATTCCGTC AGGATGCGCT AAATGAGGTT TTACTCAAAG CGCTGACACA GCCTTCCTTA 
CGCAACGCCT GGGCTGAAAA TGCGCGGTAT TATGCTGATA CCCAGGATTT ATACAGCTTA 
CCGGAGAAGG CCACGGATAT TATTACAGGT GATTTAGATG GTTGA

Protein sequence

MRVAFCLYKY FPFGGLQRDF MRIAQTVAAR GHQVRVYTQS WEGECPDNFE LIRVPVKSRT 
NHGRNAEYYA WVQHHLRDHP VDRVVGFNKM PGLDVYYAAD VCYAEKVAQE KGFFYRLTSR 
YRHYAAFERA TFEHGKPTQL LMLTNKQIAD FQKHYQTEAE RFHILPPGIY PDRKYSQQIP 
NSRQIYRQKN GISEQQKLLL QVGSDFTRKG VDRSIEALAS LPESLRQNTV LYVVGQDKPK 
KFAALAERSG VGTNVHFFSG RNDIAELMAA ADLLLHPAYQ EAAGIVLLEA ITAGLPVLTT 
AVCGYAHYIV DANCGEAMTE PFRQDALNEV LLKALTQPSL RNAWAENARY YADTQDLYSL 
PEKATDIITG DLDG