Gene SeD_A3572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3572
Symbol
ID	6872400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3427849
End bp	3429417
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	50%
IMG OID	642786560
Product	methyl-accepting chemotaxis protein II
Protein accession	YP_002217196
Protein GI	198243367
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.258237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTTGC ATAACATTAA AATACGTTCA AAATTATTTA TGGCCTTTGG CTTATTCATT 
GTTCTCATGG TGGTGAGTTC CGCTCTGTCT TTGTTTAGCC TTGATCGGGC TAATACGGGT 
ATGCAGGACA TTATTACCAA TGATTATCCC ACCACGGTAA AAGCCAATCT GTTAATCGAT 
AATTTTAATG ATTTCATCAT CGCGCAGCAG CTCATGTTAC TGGATGAAGA GGGGCGCTGG 
AGCCAGAGCT CGCAGAAAGA ACTCAGTGAG ATAAGCCAGC GCATTTCGGC GCTACTGGAT 
GAGCTTTCCA GGGAAAATAG TCACGATGCG GATTCACAGA AAATCATTAA TGAGATCCGT 
GAAGCGCGCC AGCAATACCT GGAGTCCAGA TTCCGTATTT TGAAAGATAT TCAAAGCAAT 
AATCGTCAGG CGGCCATTCA GGAGATGATG ACCAGAACGG TGCAGGTGCA AAAAGTCTAT 
AAGGACAAAG TCCAGGAACT TATCGCTGTT CAGGACGCGC AGATGCATGA AGCGAGCGTG 
CAGGTCAAAG AGGATTTTAA AAATAATCGG ACGCTGTTAA TCACTTTGGC GCTGATAAGC 
ATCGCCGCCG GAGGCGTAAT GGGATGGTAT ATTGTGCGTT CTATTACCCG GCCGCTTGAT 
GACGCAGTAC GCTTTGCCGA GGCGATTGCC GATGGCGATC TGACTCGCCA TATCACCACC 
GACTATAAAG ATGAAACAGG CGTACTACTG CAAGCGTTAA TGGCGATGAA AACGCGTCTA 
CTGGATATCG TACAGGAAGT GCAAAACGGT TCGGAAAGTA TCTCCACAGC GGCGGCGCAA 
ATTGTCGCCG GTAACCAGGA TTTGGCGGCG CGTACGGAAG AGCAGGCCAG CTCGGTTGAA 
GAAACGGCGG CGTCGATGGA ACAGATTACC GCCACGGTTA AAAATACGGC TGACCATACC 
AGTGAAGCGA CCAAACTCTC TGCCGGCGCC GCCAGCGTAG TGAAAAACAA TGGGGAGATG 
ATGAATCAAG TGACGCAGAA AATGCGCGTC ATTAACGATA CGGCAAATCG TATGTCGGAT 
ATCATCAATA TCATTGATTC CATTGCCTTT CAGACCAATA TTCTGGCGCT GAACGCGGCG 
GTTGAAGCGG CGCGCGCGGG CGAACATGGA CGTGGTTTTG CCGTTGTCGC CGGAGAGGTT 
CGCCAGTTGG CGCAAAAGAG CGCCTCGTCA GCCAGTGAAA TCCGTAATTT GATTGAAGAT 
TCAACCAGTC AGACTCAGGA AGGGATGCAC CTGGTGGAGA AAGCCAGCGC CCTGATTAAT 
GGCATGGTGG ATAACGTCGA AGAGATGGAT GTGATATTAC GTGAGATTGG GCAGGCCAGC 
CGCGAGCAAA CTGACGGTAT TTCGCAGATT AACAGCGCGA TTGGCCTGAT TGACGCCGCC 
ACGCAACAAA ACTCCTGCCT TGTGGAAGAG TCTGTTGCCG CCGCGGCGTC GCTGAACGAA 
CAGGCGTTAC ATTTAAAAGA GCTGGTTAAC GTGTTCCGCG TCCGCGAAGA GGACACGCAG 
CCCGCTTAA

Protein sequence

MFLHNIKIRS KLFMAFGLFI VLMVVSSALS LFSLDRANTG MQDIITNDYP TTVKANLLID 
NFNDFIIAQQ LMLLDEEGRW SQSSQKELSE ISQRISALLD ELSRENSHDA DSQKIINEIR 
EARQQYLESR FRILKDIQSN NRQAAIQEMM TRTVQVQKVY KDKVQELIAV QDAQMHEASV 
QVKEDFKNNR TLLITLALIS IAAGGVMGWY IVRSITRPLD DAVRFAEAIA DGDLTRHITT 
DYKDETGVLL QALMAMKTRL LDIVQEVQNG SESISTAAAQ IVAGNQDLAA RTEEQASSVE 
ETAASMEQIT ATVKNTADHT SEATKLSAGA ASVVKNNGEM MNQVTQKMRV INDTANRMSD 
IINIIDSIAF QTNILALNAA VEAARAGEHG RGFAVVAGEV RQLAQKSASS ASEIRNLIED 
STSQTQEGMH LVEKASALIN GMVDNVEEMD VILREIGQAS REQTDGISQI NSAIGLIDAA 
TQQNSCLVEE SVAAAASLNE QALHLKELVN VFRVREEDTQ PA