Gene Acid345_1631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1631
Symbol
ID	4072518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1979150
End bp	1980295
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	57%
IMG OID	637983640
Product	LacI family transcription regulator
Protein accession	YP_590707
Protein GI	94968659
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.213128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.697087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTTTCTG GCGCTGAATC GACTATCACT TTGATTCCGA TGAACGCAAA AAAGGGCAAA 
AAGCACGCAG CCACCATTCG CGACGTTGCG GCCGAGAGCG GATTCTCTCC GGCAACAGTT 
TCCATTGTTC TCAACAATGC GCCTTTGTCG CGATATATCC AGGCCACGAC CAAGGAACGA 
ATCGTGAAGG CCGCGCGCAA GTTGGGCTAT CAACCTAACC AACTGGCGCG TTCCCTACGA 
AGCCGGCGGA ACAACACCAT CGGCGTAGTC GTCTTCGATC TGACGGACCC CTTCTGCACG 
CCGATCATGC GTGGCATCGA GAACACGCTG TACCAATCTT CCTACGTGTC CCTACTCGCG 
GATGCCCACA ACGAACTCAG CCGTTTCGAG AAGTATCTCG AGATGCTGCT GGAGCGGCGC 
GTCGAAGGGA TGATCGTCAT TGCGAACTGG ACCCTGGTGG ACATCGCGCT TCTCGCGGAC 
CTCGAAAAGC GCAATATCCC TACGGTCGTC ATTGGCCGGG AACTGCAGAA CGAGACGATC 
AATTCGATCA TGGTGGATAA CGAGGCGGGG GGCCGTATCG CGTTGCAGCA CCTGCATTCT 
CTGCAGCATC GCAAAATCGC CTTTGTTCGC GGACCAAAAT CCGTGGTGGA CAGTCCGCTC 
CGCTGGCAGG GAATCACCGA CTACGCGCAA TCGGTTGGAT TGCCAGTCGA TCCAAAACTG 
GTGATCGAGT TACCCGATCG GAAGGAACCG AACTCCAGTT TCGAGGGTGG GTATCGCGCC 
GTCGAGGAAC TCATTAAGCG AAAGCGTCCG TTCACCGCTG TTCTGGCTTT CGACGACATG 
ACCGCACTCG GCGTGATGCG CGGCCTTGCA GAGCGTGGTA TATCGGTTCC CGATCAATGT 
TCCGTCATTG GATTCGACGA CGTGGCGCCG GCTGCATTCT CGAACCCAGC GCTGACAACC 
GTACGCCAGC CCATGGAAGG AATGGGTTCG ACCGCGGTGG AGATCGTGGT GGAGTCCTTG 
AGTTCCGATT TGCGGCCGGG AGAAATTTCC GTCGTACACC GGAAGATATC TCCGGAACTG 
GTAGTGCGGG CGTCCACGCG GGCAGCTTCC CTTACAAAGA CCGCATTTCC TCCCAGTGCC 
GATTAA

Protein sequence

MLSGAESTIT LIPMNAKKGK KHAATIRDVA AESGFSPATV SIVLNNAPLS RYIQATTKER 
IVKAARKLGY QPNQLARSLR SRRNNTIGVV VFDLTDPFCT PIMRGIENTL YQSSYVSLLA 
DAHNELSRFE KYLEMLLERR VEGMIVIANW TLVDIALLAD LEKRNIPTVV IGRELQNETI 
NSIMVDNEAG GRIALQHLHS LQHRKIAFVR GPKSVVDSPL RWQGITDYAQ SVGLPVDPKL 
VIELPDRKEP NSSFEGGYRA VEELIKRKRP FTAVLAFDDM TALGVMRGLA ERGISVPDQC 
SVIGFDDVAP AAFSNPALTT VRQPMEGMGS TAVEIVVESL SSDLRPGEIS VVHRKISPEL 
VVRASTRAAS LTKTAFPPSA D