Gene Dole_3068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3068
Symbol
ID	5695928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3677314
End bp	3678726
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	58%
IMG OID	641265685
Product	PAS modulated sigma54 specific transcriptional regulator
Protein accession	YP_001530948
Protein GI	158523078
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCATCA ATACCAGCAA CCGCACATCC ATTACTCCTG AGTTTGCCGT GATGCTGTTT 
GACGCCATGG CGGAAGGGGT TTTTGCTTTG GATAAAAATG GCCGCATTCT TTCGTGGAAT 
CCGGCCATGG AAAAAATCAG CGGATATCCG GCCGGCGAGG CTTTGGGCCA AAATTGCTCG 
CTTTTGAAAT TTACCGAGTG CTTTGGCAAA ACCTGCCCGG CCGGCATGAG CGAATGCGGC 
ATTTTCAAGC ACGGCCGGGT CAACTCAAAA GAGTGCCGGC TGCGGCACAA AGACGGCCGC 
CATGTGCCGG TGATGAAAAG CGCGCGGGTG GTTACCGACG ACACCGGCGA GGTGATCGGT 
GTTGTCGAGA CGGTTTCCGA TCTTACCGAA CTGCAAGAGG CCCGTCAGCA GCTGGCCGAG 
GCTGGCCGCA AGCTGGGAGA GATTCACCGG CTGGACAACA TCATCGGCAA AAGCAACGCC 
ATGAACAGGG TCTTTGCCGC GGTGGAGGCG GCCGCGGCCA GCGATGCCAC GGTTTTGATC 
CAGGGGGAGA GCGGCACCGG CAAGGAGCTG GTGGCCGGCG CCATTCATCA CAACAGCGCC 
CGTTCCCAGG GACCGATGAT CACGGTGAAC TGCAGCGCCC TGTCCGAATC CCTGCTGGAG 
AGCGAGCTTT TCGGCCATGC CAGGGGATCG TTCACCGGGG CCCATCGGGA CAGAAAAGGC 
CGTTTTGAAG AGGCTGACGG CGGTACCGTG TTCCTCGACG AAATCGGTGA AATTAGCCCT 
TTCATCCAGG TCAAGCTGCT GCGGGTGCTT CAGGAAAGAA CCGTGGAGCG GGTGGGCGAG 
TCCCAGAAAC GGTTCGTGGA CATTCGCATT CTTACCGCCA CCAATAAAAA CCTGCTGGCC 
CTTGTCAACA GCGGCGAATT CAGGCAGGAC CTTTATTACC GGCTCAAGGT TTTTCCCGTC 
CAGGTGCCGC CGCTGAAGGA TCGCAGGGAA GACATTCCCC TGCTGGTTGA GCACTTCATC 
ACGATGGAGA ACCGCAAAAC CGCCAAGAAC ATTGCGGGCG TGACAGCCAA CACCATGCGC 
CTGCTGATGG ATTACAACTG GCCGGGCAAT GTGCGGGAAT TGGAAAACGC CATTGAGCAC 
GCCTTTGTGC TGTGCTCGGA AAATGGGACT ATCTCGCCTT TTGATCTGCC GGTGGAGATT 
CGCAAGGCCG ATTATTATGC CGGTCATGGG GACGCCGGAT TGCTTTCCGT TGTCTCGCCT 
CCCCGTCCCC TGACCCGCCA CTCCCTGCTG GAGCTGCTGG CTGCCTGCAA CTGGAACAAG 
GCCGAAGTTG CCAGAAGGGC CGGCGTGAGT CGCACCGCCA TCTGGAAACA GATGAAAAAG 
TGGAATATTC CCCTTCAGCC GCCTGAAAAA TGA

Protein sequence

MGINTSNRTS ITPEFAVMLF DAMAEGVFAL DKNGRILSWN PAMEKISGYP AGEALGQNCS 
LLKFTECFGK TCPAGMSECG IFKHGRVNSK ECRLRHKDGR HVPVMKSARV VTDDTGEVIG 
VVETVSDLTE LQEARQQLAE AGRKLGEIHR LDNIIGKSNA MNRVFAAVEA AAASDATVLI 
QGESGTGKEL VAGAIHHNSA RSQGPMITVN CSALSESLLE SELFGHARGS FTGAHRDRKG 
RFEEADGGTV FLDEIGEISP FIQVKLLRVL QERTVERVGE SQKRFVDIRI LTATNKNLLA 
LVNSGEFRQD LYYRLKVFPV QVPPLKDRRE DIPLLVEHFI TMENRKTAKN IAGVTANTMR 
LLMDYNWPGN VRELENAIEH AFVLCSENGT ISPFDLPVEI RKADYYAGHG DAGLLSVVSP 
PRPLTRHSLL ELLAACNWNK AEVARRAGVS RTAIWKQMKK WNIPLQPPEK