Gene Dret_1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1849
Symbol
ID	8419690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2120534
End bp	2121568
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	54%
IMG OID	645038433
Product	histidine kinase
Protein accession	YP_003198711
Protein GI	258405969
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000588786
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCAAC CCCGATCGTT TGTTGTCCAA GTGCTGATTT TTGTTTTGGC GCAGGTGGCC 
TGGCTGGTGC TGCTCGGGCT GTGGATTTAT TGGTATACGA GCAATTATAT GGTCATCAGC 
GAGGTCGGGC CTCGCCTGCA TTCCCAACTC ATGTCCGAGG GGCTCAATCA CCTGCTCCTG 
ATCGGCGGGC TGATTCTGCT CATCGCCATT TCCACGGGGA TGTCACTTCT TTTTCACCGC 
TTGAGCGTCC AGTTCAAATT GACCCGGCTG TACGACAATT TTATCGCCAA TGTGACCCAC 
GAACTCAAAT CTCCGCTGGC CTCGATACAG CTTTCCATCG AGACCATGCG TATGCATGAA 
CTCCCCCGGG AGAAGCAGGA GGAGTTCTTC AACATGATGC TCAAGGATAC CGACCGGCTC 
AATAACCTCA TCAGTGCGAT CCTGCAGGTC CCGGCTCTGG AGCAGAAAAA AATTGCTCAC 
GATTTCCAGG TCCACCGCAT GGAGGAACTG GTTCCAGAAC TTGTTCACGA GTCGCGTGAG 
CAGTTTTCCT TGCCTGAAAA GGCGATACAG ATATCCGGGG ATGGAGGGTG TGATTGCGTT 
CTCGACCGCA ACGCCTTCCG CATTGTTCTG GACAATCTTG TAGACAACAG CATCAAATAC 
AGCCGAGAGG GAGTGGATAC AGCAATCCAT ATCAGGATGG CCTGCGAACG GGGGAAATTT 
ATTCTCCGTT TTGCTGACAA TGGCGTCGGC ATTCCACTCC AGCATCAGGA ACAGGTCTTT 
GAGAAATTTT TCCGCAGTCA TGACACGGCC ATGCCGAGCG TTAAAGGGAC CGGCCTGGGA 
CTGTACTGGG TCAAAGAGAT TATCCGCATC CACCAGGGGG CGATCCGGGT GTCCAGCCGG 
GGGACGAACA AAGGCTCCAC CTTCCGCATC GAATTGCCCC AATACGCCAA GGGCACAGAG 
CGCGCGGCGC AACGGTTGCT GCGCTTGAGC CGTAAACAAA AACAAAAGGA CACCGCACAT 
GGTGAGGGCG CCTGA

Protein sequence

MRQPRSFVVQ VLIFVLAQVA WLVLLGLWIY WYTSNYMVIS EVGPRLHSQL MSEGLNHLLL 
IGGLILLIAI STGMSLLFHR LSVQFKLTRL YDNFIANVTH ELKSPLASIQ LSIETMRMHE 
LPREKQEEFF NMMLKDTDRL NNLISAILQV PALEQKKIAH DFQVHRMEEL VPELVHESRE 
QFSLPEKAIQ ISGDGGCDCV LDRNAFRIVL DNLVDNSIKY SREGVDTAIH IRMACERGKF 
ILRFADNGVG IPLQHQEQVF EKFFRSHDTA MPSVKGTGLG LYWVKEIIRI HQGAIRVSSR 
GTNKGSTFRI ELPQYAKGTE RAAQRLLRLS RKQKQKDTAH GEGA