Gene Sama_0067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0067
Symbol
ID	4602324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	72794
End bp	75859
Gene Length	3066 bp
Protein Length	1021 aa
Translation table	11
GC content	52%
IMG OID	639779379
Product	signal transduction histidine kinase-like protein protein
Protein accession	YP_925949
Protein GI	119773209
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase [COG0745] Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTGGC TTGGCGGCGG CAAGAGTTTG GGTTACAAGC TGAATATGGC TACGGCGTTA 
CTTGCCATAG GCGTGTGTTT GCTGGTGGGA CTCTATTATC AAAACGATGT CAGTGAACGA 
ATTCGGGACG TTGCGCGACA CGAGATGGCC GACTTGGTCA ATAGTCTTAA TCTGGCGCTT 
GAAACCAAAG CCAATCGCAG CGATGTGCAG CGTGTAATGG GAGCGTTATC AACCAAGGAG 
TCCATTCGCC GTATCAGTCT CATCGAAGGC GAAAAAATTA CCGCCGATAA TCACGCTCAA 
CATATTGGCC GCACAGTGGC CGAAAGTTTT GGCAGCCAGG TTCAACAACT CATCCGTAAC 
ACTCGCACCA AAAACAGCGA CGATCCCTTT TTGGAAAAAG ACGGTGTAAT CCACCAAACA 
GCACTCCTGT ACCTTATCTC CCCCGAGCGT CAGCGACTGA GACCGTTTGT GCTTTATGTT 
GCTTATGATC CCGCCGCCCT TGAACAGGCC GCGCAAAAGG GATTTATGGA GTTCATCCTG 
ATCCAGTCGT TGGGCTTTAT GTTGTTGCTG TTCATCAACA CCCTGGTGCA ACAGAAGGTA 
GTACTCGGGC CCATTAATGC CATTCGGCGT CAGATAGAGG CCGATCCCCA ATCGGAACTT 
GCGCTCAAAG CCGACGATGA GTTGGGCCTG CTGGTTGAAA GCTACAATGC CTCAATTCGT 
CAGCGCATAA TGCAGGCCAA AGAGCTGGAG GATTCGCGCC GTTACATAGA CACAGTCATT 
AATGTTATTC CGGTCCAACT GGCGTATGTG GATGCCTCAC GCTGCTACCG TTTTATCAAT 
CGTCGTTATT TGGTTTGGCT GGGCAAAAGT GAAGCTGAGG TTTTGGGCCG CTCAGTGACA 
GACGTGTTGC CCCCACCGGT CGAAGAGTTG ATAGTGCCTT ATCAATTGAG AGCGCTGCAG 
GGGAATCAGC AAGTATTCGA TGCCGAGTTT GACGACAAAT ACTTTCAGGC AACCTATGTT 
CCGGATGTGA CCAATGATGG CGAAGTGGTG GGATTTTTTG CCTGTGTGGA AGACCTGACG 
CCCATCAAAG CCAACGAGCG TAAAATTGAA TCTTATGCGT TGGAGTTGGA GCATAAAAAC 
GCCGATTTAG TCGAGGCACG GGAAAAAGCC GAGGCGGCAT CCAGGATCAA AGCGGATTTT 
CTCGCGTGCA TGAGCCATGA AATACGCACA CCCATGAATG GCGTGCTTGG TATCCTCTCT 
TTGCTGGAGA AAACCGAGCT GTCGATTCAG CAAAAACATT ATTTGGATGT GGCTTCTACC 
AGCGCCGAAT CGTTACTGAC CCTGCTCAAC GATATTCTCG ACTTTTCCAA GATCGAATCA 
GGTAAGTTTG AAATTGATGA GGTGCCATTC GATCTTATTC AGTTACTGGA TGACTTTATC 
CAGCCCTTTG CGATTCGGGC CGAAGCCAAA GGGTTGAAGC TGTTGCTGGA CATTTCCGGT 
ATCCATCTGC GTTGGGTGCG AGGTGACCCC GGCAGGATCA GACAGGTGTT GGTCAATTTG 
GTGAGTAATG CCATTAAGTT TACTGAGGTC GGCTGGATAG CCGTGCGGGT GCAGGCGTCT 
GAAGATACTG CAAACGGCGT GTCACTGATG GTGAGTATTG AAGACACGGG GATTGGGATA 
TCCAAGGACA AGCAGGAAGT ACTGTTCTCG CCCTTTACCC AAGCCGACTC TACGACTACC 
CGCCATTTCG GTGGTACCGG ACTTGGGCTT TCAATTGCCA AACGTTTGTG TGAACTCATG 
GATGGCGATA TTCGGGTCAT CAGTGCTGAA GATGCCGGCA GTACCTTCAA GTTCCATTTA 
CGGCTTAAGT CCGAGGCGGC TTCAGGTGCC GAGTGGCCGC CTGCGCTGAA TTGCCGCGCA 
CCTTTGCTCG CGGGCGAGCT TGGTGCTTCT GAGCGAATGT TGTTCGAATT ACTCGATTCA 
TGGCAGTTAA GGCCAGCACT TCTGGAATCC AATACGGAGT TGGCACAAAC GCCGGCGCTG 
GCGGCTGCGG ATTGGCTCAT TTATTCGGTA CCAGAGCACC TGGTGTCTAT CACACAAGAG 
CTGCAAAAGA TGGCGGCATT CGCCACCGAA AAAGGGCTTA AGTTTTTAGC CATCATTTCC 
CACAGACAAC AGATTGGATT GGCCCCCACA ATCTTAAGCA GTTGCCACTA TCTGTGTCGG 
CCTATGCAGG CACTTAAGCT GGTGGACATA TTAAGCGATA GTGATGGCAA CGACGTGGTG 
TTGCCGGATG ACACACAAAG CCAGCTCAAC GATTCAGCCC AGATACTGCT GGTGGAAGAT 
AATAAGGTGA ATCAGATGGT CGCTCTGGGC ATGCTCAGAA ACCTTGGGCT TAAGCATGTG 
GAAGTGGTCA CCAACGGTTT GCAGGCACTT GCGGCACTGC AACATCGGCA ATACGACCTT 
ATTTTGATGG ATTGCCTGAT GCCGGAAATG GATGGCTATC AGGCCACCCA AGCAATTAGA 
AAAGGTGAGG CTGGACAGAA ACATAAAGAT ATCAAAATCG TCGCTATGAC AGCCAATGCC 
ATGAAAGGCG ACCGGGAAAC CTGCCTTGAG GCAGGTATGA ATGATTATAT CGCCAAGCCA 
CTACACCAAG CGGAGGTTGC CAGGGTGCTC GAGCGCTATA TTCCCCTCGA CAGCACATCC 
TGTGCACCGT CAAACCCTTT GTCGGCAGAC ACCTTATTGT TTGACCGTCA CTGTGCCCTT 
GAGCTGATGT CTGGTGATAG CGAGCTGCTG GGTGATATCC TCAAGGTGTT TGCCGAAGAA 
ATGGCCGTGT ATCTCGAGGC GTTTGAGAGC GCCATGGGCC GCAGGGACTT CGCAGCGGTG 
CGCACTGCCG TACACGCCAT CAAGGGGGCT GCGGGCAATC TGTGTATGTC GCCGTTGGCC 
GGGGTCGCCA AAGAAATGGA AATGGCCGCC CGCCGCCTGG ATTGGGTGTA CCTGGAGGCG 
CATCAGGCGG AATTTATCGA CGTATTACGA CGTACACTGG AACAAAGCCA ATTGCCGACA 
GCATAA

Protein sequence

MKWLGGGKSL GYKLNMATAL LAIGVCLLVG LYYQNDVSER IRDVARHEMA DLVNSLNLAL 
ETKANRSDVQ RVMGALSTKE SIRRISLIEG EKITADNHAQ HIGRTVAESF GSQVQQLIRN 
TRTKNSDDPF LEKDGVIHQT ALLYLISPER QRLRPFVLYV AYDPAALEQA AQKGFMEFIL 
IQSLGFMLLL FINTLVQQKV VLGPINAIRR QIEADPQSEL ALKADDELGL LVESYNASIR 
QRIMQAKELE DSRRYIDTVI NVIPVQLAYV DASRCYRFIN RRYLVWLGKS EAEVLGRSVT 
DVLPPPVEEL IVPYQLRALQ GNQQVFDAEF DDKYFQATYV PDVTNDGEVV GFFACVEDLT 
PIKANERKIE SYALELEHKN ADLVEAREKA EAASRIKADF LACMSHEIRT PMNGVLGILS 
LLEKTELSIQ QKHYLDVAST SAESLLTLLN DILDFSKIES GKFEIDEVPF DLIQLLDDFI 
QPFAIRAEAK GLKLLLDISG IHLRWVRGDP GRIRQVLVNL VSNAIKFTEV GWIAVRVQAS 
EDTANGVSLM VSIEDTGIGI SKDKQEVLFS PFTQADSTTT RHFGGTGLGL SIAKRLCELM 
DGDIRVISAE DAGSTFKFHL RLKSEAASGA EWPPALNCRA PLLAGELGAS ERMLFELLDS 
WQLRPALLES NTELAQTPAL AAADWLIYSV PEHLVSITQE LQKMAAFATE KGLKFLAIIS 
HRQQIGLAPT ILSSCHYLCR PMQALKLVDI LSDSDGNDVV LPDDTQSQLN DSAQILLVED 
NKVNQMVALG MLRNLGLKHV EVVTNGLQAL AALQHRQYDL ILMDCLMPEM DGYQATQAIR 
KGEAGQKHKD IKIVAMTANA MKGDRETCLE AGMNDYIAKP LHQAEVARVL ERYIPLDSTS 
CAPSNPLSAD TLLFDRHCAL ELMSGDSELL GDILKVFAEE MAVYLEAFES AMGRRDFAAV 
RTAVHAIKGA AGNLCMSPLA GVAKEMEMAA RRLDWVYLEA HQAEFIDVLR RTLEQSQLPT 
A