Gene Dret_0831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0831
Symbol
ID	8418649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	983387
End bp	984940
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	58%
IMG OID	645037399
Product	transcriptional regulator, NifA subfamily, Fis Family
Protein accession	YP_003197700
Protein GI	258404958
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0724194
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.196373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGT GCATGCCGTT TCTCAATACC CTCAAGCAGG TTTTGAGCGA ACTCGATCCC 
CAAAGCCCGT TGCAAACCGG TTTGCAACGG CTTTTGGATA TCATTGCCGC CAACCACGGG 
TACGAACGGC TCTCTCTGGC CATCTTCGAC CCCCAGACCG CAACCCTGCA ATTCCATCTC 
AACTACGGAG ACGACGCAGC TGCGGACGTG CGCTACGCTC CGGGCCAGGG TATTTCCGGC 
CAGGTACTGG CCTCGGGGTC ACCGTCTATT ATTCCGCGCA TGGCGGACAA CCCCGAATTC 
CTGAACCGCG CCTTTGGCCG TCCTCCGGAC GAACTGGCCG CGTGCGCCTT TATCTGTGTG 
CCCATTTTGT TGCCAAGCTC TGCCGAAGAG GGCAAAAGCC AGGAGACCAT CGGTGTCTTG 
AGCGCTGACC TGGCCACCGC TCCCAAGGAA AAGCTCGAAG AGCACTGCCG GTTTCTGGAA 
ACCTTGGCCG GGATTATCGC CCGGCAGGCC GCCCATCTCC AGGACGAACT CGCCCGGCGC 
GAACAATGGC AACGCCTCGG ACTTTTGCAC CAGGACGGCG ATTTGCTCCA GGTCGACACC 
GAAGAGATCA TCGCCTTCTC CAAGACCATG GGCATGGTCC TGCAACAGAT CTATCAGGTC 
GCACCGAGCC GGGCCACGGT CTTACTGCGC GGCGAATCCG GGACCGGGAA AGAACTCCTG 
GCTGAGGCCA TCCACCGCGC CAGCCCCCGC CGTGACAAGC CCTGCATCAA GCTCAACTGC 
GCTGCGCTTC CTGCAGACCT GTTGGAAAGC GAATTGTTCG GTCACGAAAA AGGGGCCTTT 
ACCGGGGCGG TCAGCGCCAA AAAAGGCCGC TTTGAAATGG CCCATGAAGG GACGCTTTTT 
CTGGATGAGA TCGGCGAGCT CAGTGCCGAG GCCCAGGCCA AACTCCTGCG GGCCATCCAG 
GAGGGCGAAA TCCAGCGCCT GGGCAGCGAA CGCCCCATCA AGGTCGATGT CCGCCTCGTT 
TGCGCCACCC ACCGTCCTCT GGAAATGCTC CTTGAAGATG GCAGCTTTCG CGAGGATCTG 
TATTACCGGA TCAATGTTTT TCCGGTTTTC ATCCCCTCCC TGCGCGAGCG CCGCGACGAT 
ATCATCCCTT TGACCGAACA TTTCCTGTCC TATTTCGCCC GGGAGTACCA AAAAAGTATC 
AAGCGGGTCT CCTCACCGGC TATCGATCTC CTCGTCCAAT ACCATTGGCC GGGAAACGTC 
AGGGAATTGC GCAACTGCAT TGAACGCGCT GTTTTGTTAT GCAACGAAGA TGTTATCCGG 
ACCTACCATC TGCCGCCGTC ATTGCAGACC GCTGAGAGTT CGGCCACGGA CACCGATCTC 
TCCTTCGGCG AGGCTGTGGC CCGTTTCGAA CAGGAACTCC TGGTCGAGGC GCTGAAAAAA 
ACCAAAGGAA ATATGCTCCA GGCGGCCCGC AATCTGCGCG CCAGCTACCG GATCATCAAT 
TACAAGGTCA AAAAATACGG GATCGACGTC AAACGGATCT CAGGAAAAAA ATAA

Protein sequence

MTECMPFLNT LKQVLSELDP QSPLQTGLQR LLDIIAANHG YERLSLAIFD PQTATLQFHL 
NYGDDAAADV RYAPGQGISG QVLASGSPSI IPRMADNPEF LNRAFGRPPD ELAACAFICV 
PILLPSSAEE GKSQETIGVL SADLATAPKE KLEEHCRFLE TLAGIIARQA AHLQDELARR 
EQWQRLGLLH QDGDLLQVDT EEIIAFSKTM GMVLQQIYQV APSRATVLLR GESGTGKELL 
AEAIHRASPR RDKPCIKLNC AALPADLLES ELFGHEKGAF TGAVSAKKGR FEMAHEGTLF 
LDEIGELSAE AQAKLLRAIQ EGEIQRLGSE RPIKVDVRLV CATHRPLEML LEDGSFREDL 
YYRINVFPVF IPSLRERRDD IIPLTEHFLS YFAREYQKSI KRVSSPAIDL LVQYHWPGNV 
RELRNCIERA VLLCNEDVIR TYHLPPSLQT AESSATDTDL SFGEAVARFE QELLVEALKK 
TKGNMLQAAR NLRASYRIIN YKVKKYGIDV KRISGKK