Gene Acid345_4134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4134
Symbol
ID	4072325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4892901
End bp	4894412
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	61%
IMG OID	637986165
Product	two component, sigma54 specific, Fis family transcriptional regulator
Protein accession	YP_593208
Protein GI	94971160
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.518236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.980065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGGGT CGTACCGGAT GCTGCCAGCC CAAAAAACGC GGGTTCTTAT CGTGGACGAG 
GACGTTAGCC TCGCCCGCTT CCTGCAGTCT TATCTCACCC GCCGCAATTA CGACGTCAGC 
TCCGCCACTT CCGGCGACGA AGCTATCCGC ATGTTCCGTG TCTGCGATCC GGCCCTCGTG 
CTGCTCGACG CCATGCCGAA TCTCAGCGGC GTCGAAACTC TGGAGCGCAT AAAGCAGATC 
AAGCCTGAGG TCACCGTCAT CATGACCTCC GGCGCCTCGA ATCCCGAAGT CATCTTCAAG 
GTCTCGAAGC TGGGCGCCGA AGACTACCTG GTCAAACCTT TCGACCCCGC CGAGCTCGAC 
CGCCGCATCG CCAAGATCGT CGATCGCCAG CGCGTCTCCA GCGAAGTCGT CCAGCTTCGC 
GACCAGGTCC GTCGCAACCA CGACTTCGTC GCCCTCTTCG GCACCAGTCC AAAGATGGAA 
GAAGTAAAAG AAACCATCGA GCAGGTCGCC GACACCACTG CTACTGTGCT CATCCGTGGC 
GAAAGCGGCA CCGGCAAGGA AGTTGTCGCG CGCATGATTT ACGCGCAGTC CTCGCGCCGC 
GAAAAGCCCT TCGTGAAGGT CAATTGCGCC GCCATTCCCA ACGAGTTGCT GGAGAGCGAG 
CTCTTCGGCT ACGAACCCGG CGCGTTTACC GGCGCCAATC GCCAGAAGCT CGGCAAGTTC 
GACCAGGCCC ACGGGGGCAC GATTTTCCTC GACGAAATCA GCGAGATGCA CCCGGCTCTC 
CAGGCGAAAC TCTTGCACGT GCTGCAGGAC GGCGAGTTCG CCCGGCTCGG TGGCAAGCGC 
GACATCGCCG TGGATGTCCG CGTTCTCGCT GCGACCAACA AGCCGCTGGA GCGCGCCGTC 
GGCGAAGGTC TCTTCCGCGA AGATTTGTTT TACCGGCTGA ACGTCGTCAC CGTCCACATT 
CCGCCGCTCC GCGAGCGCCA GGCGGAGATC GCCGTCTTCC TCGACTACTT CCTGCACAAG 
TACAGCGAGT TCTACGGAAA GAACCCGCCG CCGTTCAGCG AATACGCGAT CCAGCGCATG 
ATCGAGTACA CCTGGCCGGG CAACATCCGC GAGCTTGAAA ATCTCGTCAA GCGCTACGTC 
ATCGTCGGCA ACGAAGCGCA GATCATCCGC GAGCTTTCCA CCCACAAGCC GGTCATCTCT 
TCGATTTCCG GCGCCAGTCC ACTATGGGGA CTGCCGAAAG AAGTCCCGCC GCCCGTCAAC 
GACGCAGCAT CCCGGGTCAC CGCGATGCCG CCGAAACCTG CTAACGGGGA AGAGACGATG 
TCCCTGCTGG AGATCGGTCG TCGCGCGGCG CAGGCCGCCG AGCGCGAGGC CATCGAACGC 
GTCCTCAACC AGACGCGCTG GAACCGCCGC CAAGCTGCGA AAATCCTGAA AATCAGCTAC 
AAGGCGCTGC TCAACAAGCT TAAAGTCATC GAAGAGCAGA TCTCCGCCGA GCGCAAGACC 
AGCGCATCGT AG

Protein sequence

MMGSYRMLPA QKTRVLIVDE DVSLARFLQS YLTRRNYDVS SATSGDEAIR MFRVCDPALV 
LLDAMPNLSG VETLERIKQI KPEVTVIMTS GASNPEVIFK VSKLGAEDYL VKPFDPAELD 
RRIAKIVDRQ RVSSEVVQLR DQVRRNHDFV ALFGTSPKME EVKETIEQVA DTTATVLIRG 
ESGTGKEVVA RMIYAQSSRR EKPFVKVNCA AIPNELLESE LFGYEPGAFT GANRQKLGKF 
DQAHGGTIFL DEISEMHPAL QAKLLHVLQD GEFARLGGKR DIAVDVRVLA ATNKPLERAV 
GEGLFREDLF YRLNVVTVHI PPLRERQAEI AVFLDYFLHK YSEFYGKNPP PFSEYAIQRM 
IEYTWPGNIR ELENLVKRYV IVGNEAQIIR ELSTHKPVIS SISGASPLWG LPKEVPPPVN 
DAASRVTAMP PKPANGEETM SLLEIGRRAA QAAEREAIER VLNQTRWNRR QAAKILKISY 
KALLNKLKVI EEQISAERKT SAS