Gene SeD_A3949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3949
Symbol
ID	6871399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3784620
End bp	3786263
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	56%
IMG OID	642786908
Product	methyl-accepting chemotaxis protein I
Protein accession	YP_002217536
Protein GI	198242297
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.748503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TCAAAGTCAT CACCGGCGTT ATCGCGACGC TGGGCATATT TAGCGCCTTA 
TTGCTGGTGA CAGGAATACT GTTTTATTCC GCCGTCAGCA GCGATCGGCT GAATTTCCAG 
AATGCGAGCG CACTGAGTTA CCAACAACAG GAACTGGGCG GCAGTTTTCA GACATTGATT 
GAAACCCGCG TCACCATTAA CCGCGTGGCG ATACGCATGT TAAAAAATCA GCGCGATCCC 
GCCTCGCTGG ACGCCATGAA CACGCTGTTA ACCAACGCTG GCGCGTCGCT CAACGAAGCG 
GAAAAGCATT TCAACAACTA CGTGAACTCC GAAGCGATCG CAGGCAAAGA TCCGGCGTTG 
GATGCCCAGG CCGAAGCCAG CTTTAAGCAG ATGTATGACG TTTTGCAGCA GTCTATCCAC 
TATCTTAAAG CCGATAATTA CGCCGCCTAT GGCAACCTTG ACGCGCAAAA AGCGCAGGAT 
GACATGGAGC AGGTATATGA CCAGTGGCTC TCTCAAAATG CGCAATTAAT AAAATTAGCC 
AGCGATCAGA ATCAGAGCAG TTTTACCCAG ATGCAATGGA CGCTGGGGAT AATTCTACTT 
ATCGTACTCA TCGTGCTGGC GTTTATCTGG CTGGGGCTGC AACGCGTTCT ACTCCGCCCG 
CTGCAACGGA TTATGGCGCA CATTCAAACG ATCGCCGACG GCGATCTTAC CCATGAGATA 
GAGGCCGAAG GACGCAGTGA AATGGGCCAA CTGGCCGCCG GTCTTAAAAC GATGCAGCAG 
TCGTTAATCC GTACCGTCAG CGCGGTGCGC GATAACGCAG ACTCTATCTA TACTGGCGCA 
GGCGAAATTT CCGCCGGCAG CAGCGACCTC TCTTCCCGTA CCGAACAGCA GGCCTCGGCG 
CTGGAGGAGA CCGCCGCCAG CATGGAACAG TTAACCGCCA CGGTACGGCA AAACACCGAT 
AACGCACGCC AGGCGACGGG TCTGGCGAAA ACCGCATCAG AAACCGCGCG TAAAGGAGGA 
CGCGTGGTGG ATAACGTAGT GAACACCATG AACGATATCG CCGAAAGCTC GGAAAAAATC 
GTGGACATCA CCAGCGTGAT TGACGGTATC GCCTTCCAGA CTAATATCCT GGCGCTGAAC 
GCCGCGGTAG AAGCCGCCCG CGCCGGCGAA CAGGGGCGAG GATTCGCGGT CGTGGCCGGA 
GAGGTACGCA CGTTGGCCAG CCGTAGCGCG CAGGCCGCCA AAGAGATCAA AGTGCTGATT 
GAAAACTCCG TGTCGCGCAT TGATACCGGC TCTACGCAGG TACGCGAAGC GGGAGAAACC 
ATGAAAGAGA TCGTCAACGC CGTGACCCAC GTGACCGATA TTATGGGCGA AATCGCCTCT 
GCCTCCGATG AGCAAAGCAA AGGCATTGAG CAGGTGGCGC AGGCGGTATC GGAAATGGAC 
AGCGTGACGC AGCAAAACGC CTCGCTGGTA GAAGAATCCG CAGCAGCGGC GGCGGCGCTG 
GAAGATCAGG CTAACGAACT TCGTCAGGCG GTCGCCGCGT TCCACATCCA GAAACAGCCT 
CGTCGGGAGG CGTCGCCGAC GCCGTTAAGC AAAGGTTTAA CACCACAGCC CGCCGCAGAA 
CAGGCGAACT GGGAACGCTT CTAA

Protein sequence

MKNIKVITGV IATLGIFSAL LLVTGILFYS AVSSDRLNFQ NASALSYQQQ ELGGSFQTLI 
ETRVTINRVA IRMLKNQRDP ASLDAMNTLL TNAGASLNEA EKHFNNYVNS EAIAGKDPAL 
DAQAEASFKQ MYDVLQQSIH YLKADNYAAY GNLDAQKAQD DMEQVYDQWL SQNAQLIKLA 
SDQNQSSFTQ MQWTLGIILL IVLIVLAFIW LGLQRVLLRP LQRIMAHIQT IADGDLTHEI 
EAEGRSEMGQ LAAGLKTMQQ SLIRTVSAVR DNADSIYTGA GEISAGSSDL SSRTEQQASA 
LEETAASMEQ LTATVRQNTD NARQATGLAK TASETARKGG RVVDNVVNTM NDIAESSEKI 
VDITSVIDGI AFQTNILALN AAVEAARAGE QGRGFAVVAG EVRTLASRSA QAAKEIKVLI 
ENSVSRIDTG STQVREAGET MKEIVNAVTH VTDIMGEIAS ASDEQSKGIE QVAQAVSEMD 
SVTQQNASLV EESAAAAAAL EDQANELRQA VAAFHIQKQP RREASPTPLS KGLTPQPAAE 
QANWERF