Gene Acid345_2386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2386
Symbol
ID	4071384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2819767
End bp	2820777
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	59%
IMG OID	637984402
Product	LacI family transcription regulator
Protein accession	YP_591461
Protein GI	94969413
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.737452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.472555
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCTGC GCGACGTTGC GGACTATTTG GGTCTGTCGT CCACGACGGT ATCACTGGTG 
CTCAATAACT CGCCGGTAGC GAAGACGCTG TCAGAAGAGA CCCGTGAGCG CGTGCGTAAG 
GCCGCGGAGA AGTTGAGTTA CAAGCCCAAC TACTTCGCGC GGGCACTCAA CCAGAAACGC 
AACTACCAGA TCGGCATACT GGTCCCTGAC TTCGGGGAAG GTTACAACAC CAGCTTCATG 
ACCAACATCG AGCGCGAGCT CGTGGAACGC GGATATCTCT ACTTCGTTTC GAGCCACCAT 
TGGAACCCGG AAGCGATCGA TTTGCGTTTG CGCAGCTTTG TGGAGCGAGG CGTGGAGGGC 
GTAATCCTCA TCAACACGCC GCTCGCAACG CTTCCGGACG TGCCGTTGGT CGTGGTGGGA 
AGTCAGAAGT TGAAATTCCG GAGCACGCAG ATTTCTCTCG ACAACGAAGC AGGGGTGAAC 
GCGGCACTGC GGCATCTCTA TGCGCTCGGA CATCGGCACA TTGCATTCGT GAAGGGGCAT 
GAAGGATCTG TGGACGCGGA GCCGCGATGG AGGGCATTTG TCGACGGCTG TTGCGAACTC 
GGGCTGAGGA TCGATTCTAA GGCGGTGGTG CAGTTGCATC GCATCGACGA CGGACTGGAT 
CCGATCGCAG AGGGCTACAA GGCGGCCGAG ACGCTGCTTG CCTCGGGAGC GCGATTCACG 
GCGGTGGTTG CATTCAACGA TATGTCCGCG ATCGGCGCCA TGCGCAAGTT CAAGGATGCC 
GGGATTGACG TGCCAGGCAG GATCTCCATC GTCGGGTTCG ACAATGTCCC GATTGCTGGC 
TTGGTTGATC CACCACTTAC GACCATCAGC CAGCCAATTG AAGAGATGGC ACGAGTCGCA 
ACGGCCGAGG TCATCGCGCA GATCGAGACA AGCGGAAGCT TCCGCCCAAA GCAGGTTGTG 
GTGGAACCTG AACTCGTGGT GCGTCGCTCG ACGACCGCAC TTATCGCCTA A

Protein sequence

MRLRDVADYL GLSSTTVSLV LNNSPVAKTL SEETRERVRK AAEKLSYKPN YFARALNQKR 
NYQIGILVPD FGEGYNTSFM TNIERELVER GYLYFVSSHH WNPEAIDLRL RSFVERGVEG 
VILINTPLAT LPDVPLVVVG SQKLKFRSTQ ISLDNEAGVN AALRHLYALG HRHIAFVKGH 
EGSVDAEPRW RAFVDGCCEL GLRIDSKAVV QLHRIDDGLD PIAEGYKAAE TLLASGARFT 
AVVAFNDMSA IGAMRKFKDA GIDVPGRISI VGFDNVPIAG LVDPPLTTIS QPIEEMARVA 
TAEVIAQIET SGSFRPKQVV VEPELVVRRS TTALIA