Gene Dole_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2000
Symbol
ID	5694840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2421552
End bp	2423231
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	60%
IMG OID	641264598
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001529881
Protein GI	158522011
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.25845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCGGT CAACCAGTAT CGCAAACAAA ATCTGGATCA GCCTCAGCAT TCTGCTGGCC 
GGTTATTTTC TGTCCATGGC CTTTGGCTTT TTTACCGGCA TCAACACTGA GACACGGCTC 
TCTTCCGTGT ACGCCTATCT CTTTCCGGCG TCCCACAAAA GCCAGACCGC CCTCACCTCC 
TTTGAGAGCC AGCTCAAATT TTACGAAGAC GCCTATCTCA CCGGCGACAC CGAGCTTCTT 
GAAAAGGCGG AAATGGAAGC AGAAAAAGCG TACCTCGCTC TGCAGGAGAT CATCCGCCTT 
GCCGACCGAA AGCAGGTAAA AGCGGACAAG GCCATGGAGC TGCTCGACGC GCTGAAAGCA 
TTCAGTGAGG AGGCCGGCAC TGTTTATGCG GCGGTCCTGA TCCAGGCATC GGACGCGACA 
GGCACCCTGG ACAACCAACA GCGAATCTTT GCCCTGGCTC AAACGGCCAC GGACATAGGT 
GAACAGCTGA CCACGCTGAA AAACGACTAC AACGCCCAGC TTGAAACCGA CCTGTCCGCC 
ATCATCTCCT TCAGCCAGCA GTTGCGGTTC GGCAACCTGT TTCTGTTTAT CGGTATCGTG 
GTCCTCTCAG GTCTTCTGAT CCGTTTCATG GTAAGACGGT CCATTGTGCT GCCCCTGCAG 
AACGCGGTTG CCATGGTCCA GGATATCGCC ACCGGCAACC TGTCGGTGGC GATTGACGTG 
CGGCGGGCGG GCCACGACGA AATCGGCCTG CTGACCCGGT CCATGAACAC CATGGTTAAA 
AAACTGGAAG CGGTGGTGGG CCAGGTCCAG AACGCCTCTG TTAACGTGGC CTCGGGCAGC 
GAAGAGATCA GTTCCTCTTC CGAGGAACTG TCCCAGGGCG CCACGGAACA GGCCTCCCAC 
CTGGAAGAGA TCAGCTCCAG CATGGAGCAG ATGGTCTCCA ACATCAACCA GAACGCGGAC 
AACGCCTCGG AAACTGAAAA AATCGCCCGC CAGGTGGCCC AGGACGCGGA AGCCGGCGGC 
AGCCAGGTCC ATGAGACGGT GCGGGCCATG CAGGACATTG CCGGTAAAAT CTCCATTATT 
GAAGAGATCG CCCGGCAGAC CAACCTGCTG GCCCTGAACG CCGCCATTGA GGCGGCCCGG 
GCCGGTGATG CGGGACGGGG GTTTGCCGTG GTGGCGGCTG AGGTGCGAAA GCTGGCCGAA 
CGCAGCGGCC AGGCCGCCAA GGAGATTGGT GAACGGTCCG CCGGCAGCCT GGACATCGCG 
GAAAAGGCCG GGGAGATGCT GGAAAAGATC GTTCCCGACA TTCGCAAGAC CGCGGAACTG 
GTGCAGGAGA TCTCCGCCGC CTCCAGGGAG CAGACCGCCG GCGCGGCCCA GATCAACCAG 
GCCATCGGCC AGCTGGACCA GGTGGTGCAG CAGAACGCCT CTTCCGCGGA AGAGGTCTCT 
TCCACGGCCC AGGCACTGGC CGGACAGGCG GCCCAGCTTC AGGAAAGCAT CAGTTTTTTC 
AAAACAGAGG CTGGGGGAAA GGGATGGACC GACGGCACCG AAACCCCCTC AGCCGGGCCA 
CCGGAAAAAG TGGAGACAGT CCGGAAGCCG CAAATCAAGC AACCGGCAAC GGTCCACCGC 
CCGGTCGCCC TGGAAATGGG CTCAACGGAC ACCACGGACA GCGAGTTTGA ACGGTTCTGA

Protein sequence

MRRSTSIANK IWISLSILLA GYFLSMAFGF FTGINTETRL SSVYAYLFPA SHKSQTALTS 
FESQLKFYED AYLTGDTELL EKAEMEAEKA YLALQEIIRL ADRKQVKADK AMELLDALKA 
FSEEAGTVYA AVLIQASDAT GTLDNQQRIF ALAQTATDIG EQLTTLKNDY NAQLETDLSA 
IISFSQQLRF GNLFLFIGIV VLSGLLIRFM VRRSIVLPLQ NAVAMVQDIA TGNLSVAIDV 
RRAGHDEIGL LTRSMNTMVK KLEAVVGQVQ NASVNVASGS EEISSSSEEL SQGATEQASH 
LEEISSSMEQ MVSNINQNAD NASETEKIAR QVAQDAEAGG SQVHETVRAM QDIAGKISII 
EEIARQTNLL ALNAAIEAAR AGDAGRGFAV VAAEVRKLAE RSGQAAKEIG ERSAGSLDIA 
EKAGEMLEKI VPDIRKTAEL VQEISAASRE QTAGAAQINQ AIGQLDQVVQ QNASSAEEVS 
STAQALAGQA AQLQESISFF KTEAGGKGWT DGTETPSAGP PEKVETVRKP QIKQPATVHR 
PVALEMGSTD TTDSEFERF