Gene SeHA_C4082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4082
Symbol
ID	6490894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3964743
End bp	3965780
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	51%
IMG OID	642744180
Product	virulence protein
Protein accession	YP_002047784
Protein GI	194450883
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.276809
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA AATACTTAAC CCAATCCCCG GCAGGCGAAT TTGTTATGTT TGCCAGCGAT 
GACGGTGAAG TTCGTGTGGA GTGCCGCTTT GAGCAAGAGA CGCTATGGCT CCCTCAGGCA 
ACCATCGCCA ACCTTTATCA GATCACTCCC CAGGCAGTTA CACAGCACAT TAAAGCGATC 
TATGAAGAAG GCGAACTTGA GCAAAACGCA ACCTGTAAGT CTTACTTACA AGTTCAACAG 
GAAGGTAGCC GTCAGGTAAG CCGCAACAGG CTTCACTACA GCCTGCCTGT CATCCTTGCT 
GTCGGCTACC GCGTTCGTTC CCCGCGCGGC ACACAGTTCC GCCAGTGGGC AACCCAGACG 
CTCCAGAAAT ACCTGATCAA AGGTTTTGTG ATGGACGATG AGCGCCTGAA AAATCCGCCC 
GTGGGTTCAT CGGCTGTACC CGACTATTTT GATGAGATGC TGGAGCGTAT CCGCGATATT 
CGCGCCAGCG AACGTCGGGT TTATTTGCGG GTACGAGAGA TCTTTGCGTT AGCCGCCGAC 
TATCAACCAT CGCTCAAAGA AACCACGCAA TTTTTTCAAA CCATCCAGAA CAAGTTGCAT 
TTTGCCTGTA CCGGACATAC CGCTGCTGAA CTCATTCATC AGCGTGCTGA CGCCAGCCAG 
CCGCATATGG GGCTGACCAG CTATAAAGGT GAAGAGGTAC GTAAGGATGA CGTGACGGTG 
GCAAAAAATT ATCTCACTCA GGATGAAGTC AGCGAGCTTA ACCGCGTAGT TAACATGTGG 
CTGGATTTTG CCGAGGATCA GGCCCGTCGT CGTCAGCAGA TCTTTTTACG CGACTGGCAG 
GATAAGCTGG ATCAGTTCCT GCAATTTAAC GACCGTGAGG TTTTACAAGG CGCAGGTAAA 
GTCACTAAGA AAATGGCCGA TGAAAAAGCG CAGGCGGAAT ATAGTCAGTT TGCTGAACAA 
CAACGGCGCT TAAAAGAAGC CGAAGGTGAG AAGGATATCG CCGGTTTGCT ACAATGGGAA 
ACAGAACCTA AAAAGTAG

Protein sequence

MADKYLTQSP AGEFVMFASD DGEVRVECRF EQETLWLPQA TIANLYQITP QAVTQHIKAI 
YEEGELEQNA TCKSYLQVQQ EGSRQVSRNR LHYSLPVILA VGYRVRSPRG TQFRQWATQT 
LQKYLIKGFV MDDERLKNPP VGSSAVPDYF DEMLERIRDI RASERRVYLR VREIFALAAD 
YQPSLKETTQ FFQTIQNKLH FACTGHTAAE LIHQRADASQ PHMGLTSYKG EEVRKDDVTV 
AKNYLTQDEV SELNRVVNMW LDFAEDQARR RQQIFLRDWQ DKLDQFLQFN DREVLQGAGK 
VTKKMADEKA QAEYSQFAEQ QRRLKEAEGE KDIAGLLQWE TEPKK