Gene SeD_A4145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4145
Symbol
ID	6871897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3990607
End bp	3991644
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	51%
IMG OID	642787085
Product	virulence protein
Protein accession	YP_002217711
Protein GI	198243175
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.373189
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACA AATACTTAAC CCAATCCCCG GCAGGCGAAT TTGTTATGTT TGCCAGCGAT 
GACGGTGAAG TTCGTGTGGA GTGCCGCTTT GAGCAAGAGA CGCTATGGCT CCCTCAGGCA 
ACCATCGCCA ACCTTTATCA GATCACTCCC CAGGCAGTTA CACAGCACAT TAAAGCGATC 
TATGAAGAAG GCGAACTTGA GCAAAACGCA ACCTGTAAGT CTTACTTACA AGTTCAACAG 
GAAGGTAGCC GTCAGGTAAG CCGCAACAGG CTTCACTACA GCCTGCCTGT CATCCTTGCT 
GTCGGCTACC GCGTTCGTTC CCCGCGCGGC ACACAGTTCC GCCAGTGGGC AACCCAGACG 
CTCCAGAAAT ACCTGATCAA AGGTTTTGTG ATGGACGATG AGCGCCTGAA AAATCCGCCC 
GTGGGTTCAT CGGCTGTACC CGACTATTTT GATGAGATGC TGGAGCGTAT CCGCGATATT 
CGCGCCAGCG AACGTCGGGT TTATTTGCGG GTACGAGAGA TCTTTGCGTT AGCCGCCGAC 
TATCAACCAT CGCTCAAAGA AACCACGCAA TTTTTTCAAA CCATCCAGAA CAAGTTGCAT 
TTTGCCTGTA CCGGACATAC CGCTGCTGAA CTCATTCATC AGCGTGCTGA CGCCAGCCAG 
CCGCATATGG GGCTGACCAG CTATAAAGGT GAAGAGGTAC GTAAGGGTGA CGTGACGGTG 
GCAAAAAATT ATCTCACTCA GGATGAAGTC AGCGAGCTTA ACCGCGTAGT TAACATGTGG 
CTGGATTTTG CCGAGGATCA GGCCCGTCGT CGTCAGCAGA TCTTTTTACG CGACTGGCAG 
GATAAGCTGG ATCAGTTCCT GCAATTTAAC GACCGTGAGG TTTTACAAGG CGCAGGTAAA 
GTCACTAAGA AAATGGCCGA TGAAAAAGCG CAGGCGGAAT ATAGTCAGTT TGCTGAACAA 
CAACGGCGCT TAAAAGAAGC CGAAGGTGAG AAGGATATCG CCGGTTTGCT ACAATGGAAA 
ACAGAACCTA AAAAGTAG

Protein sequence

MADKYLTQSP AGEFVMFASD DGEVRVECRF EQETLWLPQA TIANLYQITP QAVTQHIKAI 
YEEGELEQNA TCKSYLQVQQ EGSRQVSRNR LHYSLPVILA VGYRVRSPRG TQFRQWATQT 
LQKYLIKGFV MDDERLKNPP VGSSAVPDYF DEMLERIRDI RASERRVYLR VREIFALAAD 
YQPSLKETTQ FFQTIQNKLH FACTGHTAAE LIHQRADASQ PHMGLTSYKG EEVRKGDVTV 
AKNYLTQDEV SELNRVVNMW LDFAEDQARR RQQIFLRDWQ DKLDQFLQFN DREVLQGAGK 
VTKKMADEKA QAEYSQFAEQ QRRLKEAEGE KDIAGLLQWK TEPKK