Gene Dret_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1201
Symbol
ID	8419029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1412408
End bp	1413823
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	61%
IMG OID	645037776
Product	PAS modulated sigma54 specific transcriptional regulator, Fis family
Protein accession	YP_003198067
Protein GI	258405325
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAGC AAACACACGC GGTCTGGAAT GTCCGCTTTT TGAATCAGAT CATGGATTCC 
ATGGCCGAAG GGGTCTTCAC CCTCGACGTC CAAGGCCGGA TCACCTCCTG GAACAGGTCG 
ATGGAGGACA TCACCGGCTA CAGCGCCTCA GAAGCCCTGG GCCGCTCCTG CCGGTTTCTG 
GGGTTCAGCC ATTGTCTGGG CACGCTCTGC CCGGCTGATA TCCACCAGTG CGGCATCCTG 
CGGCACGAAC AGCCCGAAGC CAAGGAATGT GTCCTGCGCC ATCGCGAGGG CCGGGATGTG 
CCGGTCATCA AGCAGGCCCG AGTGGTCAAA GACGACAACG GAGAACTGAT CGGCATTGTC 
GAGACCGTGA CCGACATGAC TGAACTCCAG AAGGCCCGGC ACAAGGCTGA AGAGGCAACC 
CGACTGTTGG GGCAGCACTA CAGCCTTGGC AATATCATGG GCAAAAGCGA AGTCATGCAG 
GAGGTCTTTT CCCGGGTCCG GGCCGCGGCC GCCAGCCGGT CCACCGTTCT CATCCAGGGG 
GAAAGCGGGA CCGGGAAAGA ACTCATCGCC CGCGCCATTC ACTACAACAG CGACCAGGCC 
GATCAGCCGT TCGTGACCGT CAATTGCTCG GCGCTGACGG AAACTCTTCT GGAAAGCGAG 
CTTTTCGGGC ATGTCAAAGG GGCGTTTACC GGTGCTGTGC GCGACCGGGC CGGCCGCTTT 
GAAGAAGCGC ATCGCGGATC GATTTTCCTG GATGAAATCG GGGAACTCAG CCAGACCATC 
CAGGTCAAGC TGCTGCGCGT CCTGCAGGAA CGGGAAGTCG AACGGGTCGG CGACTCACAA 
ACCCGCACGA TCGATATCCG GGTCATCGTG GCTACACACC GGGATCTCAA CGAGCTCTTG 
GCCCAGGGCG TTTTTCGTCA GGACCTGTAT TACCGCCTCA AGGTTTTTCC TATCACCCTG 
CCCCCATTGC GCCAGCGGCG CGAAGACCTG CCCCTGCTGG TCAACCACTT TATCGCCAAG 
CAAAACGAAG CCACCGGAAA ACGGGTCACC GGCCTGGCAC CGGAGGCCAT GCGGCTGGTG 
TTCGAGTACC ATTGGCCCGG CAATGTGCGT GAATTGGAAA ACGCCATCGA ACACGCCTTT 
GTCCTGACTT CCGGGGAGCA GATCCAGGTC AACGATCTGC CGGCGGAGAT CATAACGCCC 
CGGCCGAGCC CGGAAAGAGC CAGGGAAGCC GGCGTTCCCC GGACCGCTGG CAGCAGACAG 
CACCATGAAC AGCCCGACCG GGAGCAGTTG CTCGCGCTGC TGGAGGCCAA CCAGTGGAAC 
AAGGCCGCGG TGGCCCGGCA ACTCGGGGTG AGCCGGACGG CGGTGTGGAA GTACATGAAA 
AAGTGGGGCA TTCCGCTGCA GCCGGAACCA GATTAA

Protein sequence

MTEQTHAVWN VRFLNQIMDS MAEGVFTLDV QGRITSWNRS MEDITGYSAS EALGRSCRFL 
GFSHCLGTLC PADIHQCGIL RHEQPEAKEC VLRHREGRDV PVIKQARVVK DDNGELIGIV 
ETVTDMTELQ KARHKAEEAT RLLGQHYSLG NIMGKSEVMQ EVFSRVRAAA ASRSTVLIQG 
ESGTGKELIA RAIHYNSDQA DQPFVTVNCS ALTETLLESE LFGHVKGAFT GAVRDRAGRF 
EEAHRGSIFL DEIGELSQTI QVKLLRVLQE REVERVGDSQ TRTIDIRVIV ATHRDLNELL 
AQGVFRQDLY YRLKVFPITL PPLRQRREDL PLLVNHFIAK QNEATGKRVT GLAPEAMRLV 
FEYHWPGNVR ELENAIEHAF VLTSGEQIQV NDLPAEIITP RPSPERAREA GVPRTAGSRQ 
HHEQPDREQL LALLEANQWN KAAVARQLGV SRTAVWKYMK KWGIPLQPEP D