Gene Sde_2554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2554
Symbol
ID	3968720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	3240385
End bp	3241971
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	45%
IMG OID	637921652
Product	sensor protein PilS
Protein accession	YP_528026
Protein GI	90022199
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.041487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAACC AGTACCAACA CAACCCGCAA CTACTGCGCG TATATTTATT TTACCGCGTT 
GCCCTTTCGA CTATTTTGCT CGCCATGTAT GAAACTGGCC TAGGTCAGAA TGCACTGGGC 
ACCCACGAAC CAGAGTTGTT TCGCTGGACC ATCGCACTGT ATACGGCCAT ATCCATTGGC 
TCGCTGTACG TTTTTCGCCC AAGTTTATTA ACGCGCTCGC TTCACCGGTT AACTTTTTTA 
CTTGTATTAG ATCTTATTGC CATGCTACTG GTTATCCATT CTAGCGGTGG CCCAGATAGC 
GGCTTGGGCT ATTTACTACT TGTATGCACA GCCATGGCCA GTGTGTTTAT CCGCGGTCAA 
CTTGCTTTAG CCTACGCAGC ACTTATTACT TTGTTTCTTA TTGCAGAAAC CATCTACATT 
ACCCAAGACC CCAAAGACCT TACCAAAGGC CTATTTTCTA CCGGTATTCT TGGCATTCTG 
GTGTTTGCCA CCACAATTAC TTTTTTGTAT TTAACCGAGA AAATTCGCTC GAGTGATATT 
GCGGCCGTAA CACAAGCAAA ATACGCAGAA CACTTAGAAA AATTGGCACA ACATATCGTC 
ACACGTATGC GCACCGGCGT TGTAGTTATA GATGGCGAAA ACAAAATAGA GCTGATTAAT 
GAATCTGCAC TGCAACTGCT AGATTTACCG CAAGACACCG CCTACATAGG CGCCCCACTC 
TCTGATTTCT CTAATTTGGA AGATATGCTC CAGCAATGGC AGTACAACCC CATTGTAGGT 
TTACCCAAGG TACATACATT GCGTGACGGG CATGAGGTGC GTATAAACTT TGCACAACTT 
GAAACGAATG AACTTGCGCG CACTATTTTG TATATAGAAG ATCACCGCGC CATAGTGCAG 
CAAGCTCAAC AGTTAAAGCT TGCATCTCTA GGTAGGCTCA CAGCGAGTAT CGCGCACGAA 
GTACGCAACC CTCTCGGAGC AATCGCCCAT GCTGCTCAGC TACTGAAAGA GTCCGAGACC 
ATCGATGCTG GCGACAATCG CTTAACCGAA ATTATTTTGC AGCATTCTGA GCGTGTAAAC 
CAAATTATTA ATAACACCCT GATCCTGTCA CGCCGAAAAG AACCTAAACC AGAAATGCTC 
GACTTGGCCA CTTGGCTGCC ACACTTTATT AACTCGTTTA AGCTCGCGAT TGAAGGCAAA 
ATAGACTTAC ATATAGTGCA CGCTCAAATT CAAGCTAAAG CAGACCCCTC GCAACTTACT 
CAGGTACTTA CCAACTTGTG CGAAAATGGT TTGCGACACA GCAAATTGCT AACAGGGGAA 
GCACGCATTA AAATTTGCGC AAATATAAGT GTTAACGATC ACACCCCCTA TATAGATGTG 
ATCGACTTTG GCGCGGGCGT CCCTGAGCAC CAACTGCAAC AAATATTCGA CCCATTCTTT 
ACAACGGACG ATAAAGGTAC AGGGCTAGGG CTGTATATTT CCAAAGAGCT ATGTGAAATT 
AACCAAGCCT CGTTGCACTA CAACCGCACA CAAGACAATC AAAGCTGCTT TAGAATAAGC 
TTTTCGCACC ACCAGAGAAA AATATAA

Protein sequence

MENQYQHNPQ LLRVYLFYRV ALSTILLAMY ETGLGQNALG THEPELFRWT IALYTAISIG 
SLYVFRPSLL TRSLHRLTFL LVLDLIAMLL VIHSSGGPDS GLGYLLLVCT AMASVFIRGQ 
LALAYAALIT LFLIAETIYI TQDPKDLTKG LFSTGILGIL VFATTITFLY LTEKIRSSDI 
AAVTQAKYAE HLEKLAQHIV TRMRTGVVVI DGENKIELIN ESALQLLDLP QDTAYIGAPL 
SDFSNLEDML QQWQYNPIVG LPKVHTLRDG HEVRINFAQL ETNELARTIL YIEDHRAIVQ 
QAQQLKLASL GRLTASIAHE VRNPLGAIAH AAQLLKESET IDAGDNRLTE IILQHSERVN 
QIINNTLILS RRKEPKPEML DLATWLPHFI NSFKLAIEGK IDLHIVHAQI QAKADPSQLT 
QVLTNLCENG LRHSKLLTGE ARIKICANIS VNDHTPYIDV IDFGAGVPEH QLQQIFDPFF 
TTDDKGTGLG LYISKELCEI NQASLHYNRT QDNQSCFRIS FSHHQRKI