Gene Csal_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2019
Symbol
ID	4027103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2280856
End bp	2282559
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	63%
IMG OID	637967214
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_574069
Protein GI	92114141
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAA TGCTGAACGA CCTTTCGGTC AGGGCCAGCT TGACGATCGC ATTGACCGTC 
ATGGTCGTCA TGTGCGCGAT CATCAGCGCC ATGGGATTCT ATTCGAACCA GAAAAGCGCC 
GAGGCGATGG AGACCATCGG CACCATCGGG TTCGAGCAGA CCAACACCAT CAACCGCGCC 
ACCGTGAACC TGATACGTGC GCGCGGTCTG CTGGCCAGCT ACCGAAATGC GGTGGAAGCC 
GGGGATACCG AGCGAGCGCA AGACTTGCAG ACAGCGGTTG CCAACGCCGT GGGCCAGGCA 
AGCGATCGTA TCGATCAGTT CGCTCAGGTG ACCAAGACGG ATGCCGGACA AGAATACGCG 
GCACGCATCG ACGAGGCTTT TGTCGCCTTG CGCGACGAAA TCGAACGTGA AATGAACGCC 
GGCGAGGATG CCGTGCGTAC CGAGGACGAT CAGCGCATCA ACCCGCTGAT GGACGACCTC 
GACGATAGCG TGCGCGATTT CATCAAGTAT GCCGAGGGGC GTGTCGGCGA CGCCATCGTG 
GCGGATGCCG GCAACAGCCA GCTGATGGAA ATCCTGTCCA TCGTGCTGCT GGTTCTCGCC 
ATCATCGTGG CGATTCTGGT GCGTCTGGTG CTCGTCAAGT CCGTGGTCAA GCCGCTGGAT 
GAAGCGGTCG AGCATTGCGA ACACATCGCC AAGGGCGACC TCTCGCACCA TGTCGACGAA 
CGTGGCAAGA ACGAAATCGG CCGCCTGTTC AACGCCATGC GCGACATGCA GCAAGGCCTG 
GTGGGGACGG TCACCTCCGT GCGCGAGGCC AGCGGCTCGA TTCATGGCGG GGCCCGCGAG 
ATTGCCTCCG GGAACGCCGA TTTGTCCTCG CGCACCGAGC AGCAGGCCGC CTCGCTCGAG 
GAAACCGCGT CGAGTATGGA AGAGCTGACC TCCACCGTGC GCCAGAACGC CGACAATGCG 
CGTCAGGCGA GTTCCCTGGC CAATGATGCC TCGACCACGG CCGGACGCGG CGGCGATGTC 
ATGCAGGAGG TCTCCACGAC CATGCAGGGC ATCACCGAAA GCTCCAAGCA GATCTCCGAT 
ATCATCGGCA TGATCGATTC GATCGCCTTC CAGACCAACA TTCTGGCGCT CAACGCCTCG 
GTCGAGGCGG CGCGTGCCGG TGAACAGGGC CGCGGGTTCG CCGTGGTCGC CAGCGAGGTG 
CGCAACCTGG CCAGCCGCAG TGCCGAAGCC GCCAAGGAAA TCAAGGGGCT GATCCACACC 
TCGACCACAC AGATCGAGCA GGGCTCCGAG CTGGTCGGCA ATGCCGAAAC CACCATGCGC 
GACGTGGTGC AGGCCGTGAA GCGCGTCAGC GACATCATGG ATGAAATTTC CGCGGCGTCG 
CAGGAGCAGA GCGACGGCAT CGAGCAGGTG AGCCAGGCCG TGACCCAGAT GGACCAGGTG 
ACCCAGCAGA ATGCCTCCCT GGTTCAGGAA GCCTCCAGCG CCTCCGCGTC GCTCGAGGAA 
CAGGCGCAGC GCCTGGAAGA CGTGGTGTCC ACGTTCCGTC TGCCGGGCGG CAGCACGCGT 
CAGTTGTCGC GTGCCAATAC GTCGCCCGGC AAGTCCGCCG GATCGTCCGC GACGCCATCG 
ACCTCTGCGC AGGGTGCCTC TCAGCGTGTG CCGGCCAAGC GCGCGCCGGT CACCCAAGAA 
GAGGACGAGT GGGAAGAATT CTAA

Protein sequence

MGKMLNDLSV RASLTIALTV MVVMCAIISA MGFYSNQKSA EAMETIGTIG FEQTNTINRA 
TVNLIRARGL LASYRNAVEA GDTERAQDLQ TAVANAVGQA SDRIDQFAQV TKTDAGQEYA 
ARIDEAFVAL RDEIEREMNA GEDAVRTEDD QRINPLMDDL DDSVRDFIKY AEGRVGDAIV 
ADAGNSQLME ILSIVLLVLA IIVAILVRLV LVKSVVKPLD EAVEHCEHIA KGDLSHHVDE 
RGKNEIGRLF NAMRDMQQGL VGTVTSVREA SGSIHGGARE IASGNADLSS RTEQQAASLE 
ETASSMEELT STVRQNADNA RQASSLANDA STTAGRGGDV MQEVSTTMQG ITESSKQISD 
IIGMIDSIAF QTNILALNAS VEAARAGEQG RGFAVVASEV RNLASRSAEA AKEIKGLIHT 
STTQIEQGSE LVGNAETTMR DVVQAVKRVS DIMDEISAAS QEQSDGIEQV SQAVTQMDQV 
TQQNASLVQE ASSASASLEE QAQRLEDVVS TFRLPGGSTR QLSRANTSPG KSAGSSATPS 
TSAQGASQRV PAKRAPVTQE EDEWEEF