Gene SeHA_C3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3889
Symbol
ID	6489073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3757944
End bp	3759587
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	55%
IMG OID	642743996
Product	methyl-accepting chemotaxis protein I
Protein accession	YP_002047602
Protein GI	194447735
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TCAAAGTCAT CACCGGCGTT ATCGCGACGC TGGGCATATT TAGCGCCTTA 
TTGCTGGTGA CAGGAATACT GTTTTATTCC GCCGTCAGCA GCGATCGGCT GAATTTCCAG 
AATGCGAGCG CACTGAGTTA CCAACAACAG GAACTGGGCG GCAGTTTTCA GACATTGATC 
GAAACCCGCG TTACCATTAA CCGCGTGGCG ATACGCATGT TAAAAAATCA GCGCGATCCC 
GCCTCGCTGG ACGCCATGAA CACGCTGTTA ACCAACGCTG GCGCGTCGCT CAACGAAGCG 
GAAAAACATT TCAACAACTA CGTGAACTCC GAAGCGATCG CGGGAAAAGA TCCGGCGTTG 
GATGCCCAGG CCGAAGCCAG CTTTAAGCAG ATGTATGACG TTTTGCAGCA GTCTATCCAC 
TATCTTAAAG CCGATAATTA CGCCGCCTAT GGCAACCTTG ACGCGCAAAA AGCGCAGGAT 
GACATGGAGC AGGTATATGA CAAGTGGCTC TCTCAAAATG CGCAATTAAT AAAATTAGCC 
AGCGATCAGA ATCAGAGCAG TTTTACCCAG ATGCAATGGA CGCTGGGGAT AATTCTACTT 
ATCGTACTCA TCGTGCTGGC GTTTATCTGG CTGGGGCTGC AACGCGTTCT ACTCCGCCCG 
CTGCAACGGA TTATGGCGCA CATTCAAACT ATCGCCGACG GCGATCTTAC CCATGAGATA 
GAGGCCGAAG GACGCAGTGA AATGGGCCAA CTGGCCGCCG GTCTTAAAAC GATGCAGCAG 
TCGTTAATCC GTACCGTCAG CGCGGTGCGC GATAACGCAG ACTCTATCTA TACTGGCGCA 
GGCGAAATTT CCGCCGGCAG CAGCGACCTC TCTTCCCGTA CCGAACAGCA GGCCTCGGCG 
CTGGAGGAGA CCGCCGCCAG CATGGAACAG TTAACCGCCA CGGTACGGCA AAACACCGAT 
AACGCACGAC AGGCGACGGG TCTGGCGAAA ACCGCATCAG AAACCGCGCG TAAAGGAGGA 
CGCGTGGTGG ATAACGTAGT GAGCACCATG AACGATATCG CCGAAAGCTC GGAAAAAATC 
GTGGACATCA CCAGCGTGAT TGACGGTATC GCCTTCCAGA CTAATATCCT GGCGCTGAAC 
GCCGCGGTAG AAGCCGCCCG CGCCGGCGAA CAGGGGCGAG GATTCGCGGT TGTGGCCGGA 
GAGGTACGCA CGTTGGCCAG CCGTAGCGCG CAGGCCGCCA AAGAGATCAA AGTGCTGATT 
GAAAACTCCG TGTCGCGCAT TGATACCGGC TCTACGCAGG TACGCGAAGC GGGAGAAACT 
ATGAAAGAGA TCGTTAACGC CGTGACCCGC GTGACCGATA TTATGGGCGA AATCGCCTCT 
GCCTCCGATG AGCAAAGCAA AGGCATTGAG CAGGTGGCGC AGGCGGTATC GGAAATGGAC 
AGCGTGACGC AGCAAAACGC CTCGCTGGTA GAAGAATCCG CAGCAGCGGC GGCGGCGCTG 
GAAGATCAGG CTAACGAACT TCGTCAGGCG GTCGCCGCGT TCCGCATCCA GAAACAGCCT 
CGTCGGGAGG CGTCGCCGAC GCCGTTAAGC AAAGGTTTAA CGCCACAGCC CGCCGCAGAA 
CAGGCGAACT GGGAAAGCTT CTAA

Protein sequence

MKNIKVITGV IATLGIFSAL LLVTGILFYS AVSSDRLNFQ NASALSYQQQ ELGGSFQTLI 
ETRVTINRVA IRMLKNQRDP ASLDAMNTLL TNAGASLNEA EKHFNNYVNS EAIAGKDPAL 
DAQAEASFKQ MYDVLQQSIH YLKADNYAAY GNLDAQKAQD DMEQVYDKWL SQNAQLIKLA 
SDQNQSSFTQ MQWTLGIILL IVLIVLAFIW LGLQRVLLRP LQRIMAHIQT IADGDLTHEI 
EAEGRSEMGQ LAAGLKTMQQ SLIRTVSAVR DNADSIYTGA GEISAGSSDL SSRTEQQASA 
LEETAASMEQ LTATVRQNTD NARQATGLAK TASETARKGG RVVDNVVSTM NDIAESSEKI 
VDITSVIDGI AFQTNILALN AAVEAARAGE QGRGFAVVAG EVRTLASRSA QAAKEIKVLI 
ENSVSRIDTG STQVREAGET MKEIVNAVTR VTDIMGEIAS ASDEQSKGIE QVAQAVSEMD 
SVTQQNASLV EESAAAAAAL EDQANELRQA VAAFRIQKQP RREASPTPLS KGLTPQPAAE 
QANWESF