Gene SeD_A1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1947
Symbol
ID	6872186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1874900
End bp	1876099
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	43%
IMG OID	642785069
Product	type III secretion apparatus protein, YscD/HrpQ family
Protein accession	YP_002215735
Protein GI	198243835
COG category
COG ID
TIGRFAM ID	[TIGR02500] type III secretion apparatus protein, YscD/HrpQ family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.389941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAATC CAAAGAGTTC CTGGAAAATA CGTTTTTTAG GTCACGTTTT ACAAGGCCGG 
GAAGTATGGC TGAATGAAGG TAACCTGTCA CTGGGGGAGA AAGGATGCGA TATTTGTATT 
CCGCTTACTA TAAATGAAAA AATTATTCTG AGAGAACAGG CAGATAATTT ATTTGTTGAT 
GCCGGGAAAG CCAGAGTTAG AGTTAATGGC CGCAGATTTA ATCCAAATAA GCCGCTACCA 
TCCAGTGGGG TTTTGCAGGT TGCGGGAGTG GCTATCGCGT TTGGTAAACA GGATTGTGAA 
CTTGCTGATT ATCAAATACC CGTTTCCAGA TCAGGGTACT GGTGGTTGGC TGGCGTATTC 
TTGATTTTCA TCGGTGGAAT GGGTGTCCTG TTAAGTATTA GTGGTCAGCC TGAAACGGTA 
AATGACTTAC CTTTGCGGGT TAAGTTTTTA TTAGACAAAA GCAATATTCA TTATGTGCGG 
GCGCAATGGA AAGAAGATGG CAGCCTGCAG TTGTCCGGTT ATTGCTCGTC AAGCGAACAG 
ATGCAAAAGG TGAGAGCGAC TCTCGAATCA TGGGGGGTCA TGTATCGGGA TGGTGTAATC 
TGTGATGACT TATTGGTACG AGAAGTGCAG GATGTTTTGA TAAAAATGGG TTACCCGCAT 
GCTGAAGTAT CCAGCGAAGG GCCGGGGAGC GTGTTAATTC ATGATGATAT ACAAATGGAT 
CAGCAATGGC GTAAGGTTCA ACCATTACTT GCAGATATTC CCGGGTTATT GCACTGGCAG 
ATTAGTCACT CTCATCAGTC TCAGGGAGAT GATATTATTT CTGCGATAAT AGAGAACGGT 
TTAGTGGGGC TTGTCAATGT TACGCCAATG CGGCGCTCTT TTGTTATCAG TGGTGTACTG 
GATGAATCTC ATCAACGCAT TTTGCAAGAA ACGTTAGCAG CATTAAAGAA AAAGGATCCC 
GCTCTTTCTT TAATTTATCA GGATATTGCG CCTTCCCATG ATGAAAGCAA GTATCTGCCT 
GCGCCAGTGG CTGGCTTTGT ACAGAGTCGC CATGGTAATT ACTTATTACT GACGAATAAA 
GAGCGTTTAC GTGTAGGGGC ATTGTTACCC AATGGGGGAG AAATTGTCCA TCTGAGTGCC 
GATGTGGTAA CGATTAAACA TTATGATACT TTGATTAACT ATCCATTAGA TTTTAAGTGA

Protein sequence

MVNPKSSWKI RFLGHVLQGR EVWLNEGNLS LGEKGCDICI PLTINEKIIL REQADNLFVD 
AGKARVRVNG RRFNPNKPLP SSGVLQVAGV AIAFGKQDCE LADYQIPVSR SGYWWLAGVF 
LIFIGGMGVL LSISGQPETV NDLPLRVKFL LDKSNIHYVR AQWKEDGSLQ LSGYCSSSEQ 
MQKVRATLES WGVMYRDGVI CDDLLVREVQ DVLIKMGYPH AEVSSEGPGS VLIHDDIQMD 
QQWRKVQPLL ADIPGLLHWQ ISHSHQSQGD DIISAIIENG LVGLVNVTPM RRSFVISGVL 
DESHQRILQE TLAALKKKDP ALSLIYQDIA PSHDESKYLP APVAGFVQSR HGNYLLLTNK 
ERLRVGALLP NGGEIVHLSA DVVTIKHYDT LINYPLDFK