Gene Acid345_3750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3750
Symbol
ID	4069325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4425167
End bp	4426306
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	55%
IMG OID	637985772
Product	Fis family transcriptional regulator
Protein accession	YP_592824
Protein GI	94970776
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.634996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA ACCTTTCTGG CATCTCTCGA TCAGGCGAGA TCTTCGGCAG CATTCTCCTA 
ATCGATCCTG CGCTTGCTCG TCCAGCGCTC GTCCAACACC AACGAGTTGG AGAAATCCAC 
TTGCGAACTT CCCCTCGCTT CAACGTGACC AGCAGTGAAA TACCTAGCTT CGAGGGAATT 
GTCGGCTCCA GTTCGTCCTT GAGCAGAGCT TTGGATCGGG TGATGACCGT CGCACCGACG 
GATGCTACTG TTTTAATCCA CGGCGAGACC GGGACTGGTA AAGAATTGAT CGCGCAGGCA 
GTGCACCGTC TTGGTCGGCG TCGTAATGGC CGCTTCGTAC GATTCAATTG CGCCGCGATT 
CCTCTCGGCT TGCTCGAAAG TGAACTCTTT GGCCATGAAA AAGGAGCGTT CACCGGCGCC 
GTCGCCCGCA AGATCGGCCG CTTTGAACTC GCTAACAACG GAACGCTGTT CCTCGATGAA 
ATTGGTGACA TCCCTCTCGA GTTGCAGGCA AAGTTGTTGC GTGTGCTTCA GGAACGGGAG 
TTTGAACGAT TGGGCAGCAA TCAGACCCTG CATGTTAACG TACGCCTAAT CGCCGCCAGT 
CACCGAGATC TTCGCCAAAT GGTACGCGAA GGCAAGTTTC GGGAGGATCT TTTCTACCGG 
CTGAACATCT TCCCTATTAC GGTTCCAGCG TTGCGTGAAC GTCGTGACGA TATTCCCGCC 
CTCATTCGGT ATTTCGCTGA GGATTGCGTT CGCCGCTTAG ACCGTCGGGT CAATCTCGTT 
CCCCTCGAAA CAGTACGAGC TCTGACCGAA TATGACTGGC CTGGCAACAT TCGCGAGCTC 
CAGAATTTCA TGGAACGATC AGTGATCCTA TCGCAAGGTG TCGAACTACA AGCCCCTCTC 
GACGATCTCC GCTGGTCAAA ACCGGTGAAT GGGCCGGAGA CTCAAACGTT ATCCCAAGCA 
GAATACGGGC ATATCCTAAG CGTCTTAAAA ACGACGAACT GGGTAGTCGG CGGCCCAGCG 
GGTGCTGCCC TGAAATTGGG GTTGAAGCGT ACCACATTGA TCGGGAAGAT GAGAAAGCTT 
GGCCTCTCGC GTTCGCGCGA AGCGAGCGTA CAGCATAGCG GCACAGTCAC GAATCGCTGA

Protein sequence

MSGNLSGISR SGEIFGSILL IDPALARPAL VQHQRVGEIH LRTSPRFNVT SSEIPSFEGI 
VGSSSSLSRA LDRVMTVAPT DATVLIHGET GTGKELIAQA VHRLGRRRNG RFVRFNCAAI 
PLGLLESELF GHEKGAFTGA VARKIGRFEL ANNGTLFLDE IGDIPLELQA KLLRVLQERE 
FERLGSNQTL HVNVRLIAAS HRDLRQMVRE GKFREDLFYR LNIFPITVPA LRERRDDIPA 
LIRYFAEDCV RRLDRRVNLV PLETVRALTE YDWPGNIREL QNFMERSVIL SQGVELQAPL 
DDLRWSKPVN GPETQTLSQA EYGHILSVLK TTNWVVGGPA GAALKLGLKR TTLIGKMRKL 
GLSRSREASV QHSGTVTNR