Gene Dret_2337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2337
Symbol
ID	8420197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2657154
End bp	2658719
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	57%
IMG OID	645038939
Product	sigma54 specific transcriptional regulator, Fis family
Protein accession	YP_003199198
Protein GI	258406456
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTT CACACGAATC TTTTTTTCGG GAAGCGGTCC TGCGTATCTG CAGCAGCCTG 
GACATCGACA AGGCCCTGGA GCGATGCCTG GAGTATGTCA AACAATTTAT CCCTGCTGAC 
TCCATGCATT TATCGGTTTA TTTGCCGGAT GTGCAGATGT TGCAGTTTGT GGCTGTGGCT 
GGTGAGGGGT ATGAAGTCAC CAATGCCGAT GCGATCTCAG TCCCGGCCAT TGATTGGGAG 
GCGCCGGAAA ATCAGCGGCC GGGGATGCCT TTTGTCCATG TGGTCAACGA TCCCGCCAAC 
GAACCGGAGG TGGAGACGGT TCTGCACCAA CTGAACCTCT CTTCTGATTT TTCGGTGATG 
GTCATGCATC TGTATCTGGA TGGCAGTTCC ATCGGTGAAG TCGCTGTCCG GAGCCAGGGA 
ACGCACAAGT ATACGGAGGA ACACGGTCGG CTGTTCGTCC TGCTCCGCGA GCCCCTGTCC 
ATCGCGCTGG CCAATGCCTT GAAGCACAGG GAGGTTGTCC GGCTCAATGA ATTGTTGGCC 
GACGACAGCC GGTATTTCCA GCAGGAACTG CGGGCCAAAC AAGGCCAAGA AGTGGTTGGG 
GCGGAATTCG GATTGCGCGG GGTCATGGAG CAGGCGCAGC AAGTCGCGCA ATTGGACAAT 
CCGGTGCTGT TGCTCGGGGA AACGGGCTGC GGCAAGGGGA TGATCGCCGA TACTATCCAC 
AAACTTTCGC GCCGTGCTCA GGGGCCTATG ATCACGGTGA ATTGTGGAGC TATTCCTGCT 
TCGTTACTGG AAAGTGAATT GTTCGGCCAT GAAAAAGGGG CGTTTACCGG GGCGGAACGG 
CAGAAAAGAG GGCGGTTTGA ACGCGCCCAG GGCGGCACGG TCTTTTTGGA CGAAATCGGG 
GAACTGCCTC TTGAATCCCA GGTCAAGTTG CTTCACGTGC TGCAACACAA GGAGATTGAA 
CGTGTGGGAG GCAGCCAGAC CATTGCTTTG GATATCCGGA TCATTGCCGC CACGAATCGG 
GACTTGGCGG GCATGGTCAG CAGCGGGCAG TTTCGGGAGG ATCTCTGGTA CCGTTTGAAT 
GTCTTTCCGG TCATGGTGCC GCCGCTGCGG CAGCGCAAAG AAGATATTCC GGCCCTGGTC 
CGGTACTTTT TGCAGCACAA AGCCGTGGAA TTGAAACTCC CGTCCCGTCC GAAACTCCCG 
AGCGGAGCGC TGGACAAGCT CATGGCCTAC CATTGGCCCG GCAATGTCCG CGAGTTGGAG 
AATTTTATTG AACGCGCCCT TATCCAAACC CCCGGGGGGG AATTGGAAAT CGATTCCCTT 
TTGGACAATC TGCTCCAGAC GGATGGGACC AGGGGGAGTT GGGAACCGGA AGTCAACAGC 
AACCAGCTCC CCTCACTGGA GACGGTATGC GCCGAACATA TCCGAAAGGC CCTCCGGCGG 
GCAGGCGGCA AAATCAGTGG GCCCGGCGGA GCTGCGGAAA TGCTTGGGGT CCACCCGAAT 
ACGCTCAGAC AGCGCATGGA CAAAATGGGC ATTGCGTATA AACGGCGTTT ACGAAACCGC 
TTTTGA

Protein sequence

MPFSHESFFR EAVLRICSSL DIDKALERCL EYVKQFIPAD SMHLSVYLPD VQMLQFVAVA 
GEGYEVTNAD AISVPAIDWE APENQRPGMP FVHVVNDPAN EPEVETVLHQ LNLSSDFSVM 
VMHLYLDGSS IGEVAVRSQG THKYTEEHGR LFVLLREPLS IALANALKHR EVVRLNELLA 
DDSRYFQQEL RAKQGQEVVG AEFGLRGVME QAQQVAQLDN PVLLLGETGC GKGMIADTIH 
KLSRRAQGPM ITVNCGAIPA SLLESELFGH EKGAFTGAER QKRGRFERAQ GGTVFLDEIG 
ELPLESQVKL LHVLQHKEIE RVGGSQTIAL DIRIIAATNR DLAGMVSSGQ FREDLWYRLN 
VFPVMVPPLR QRKEDIPALV RYFLQHKAVE LKLPSRPKLP SGALDKLMAY HWPGNVRELE 
NFIERALIQT PGGELEIDSL LDNLLQTDGT RGSWEPEVNS NQLPSLETVC AEHIRKALRR 
AGGKISGPGG AAEMLGVHPN TLRQRMDKMG IAYKRRLRNR F