Gene Acid345_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2172
Symbol
ID	4073114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2591897
End bp	2593330
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	62%
IMG OID	637984188
Product	GntR family transcriptional regulator
Protein accession	YP_591247
Protein GI	94969199
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTCG TAATACCACT TTCGCGAGAC CAGGCGCCAC TGTTTCAGCA GGTGTATGCC 
GGCCTTCGTG ACGCTATCCT TACCGGGAAA GTCCCGGCTG GTTCCCGCCT ACCCTCCACG 
CGCGAAATGG CGACACAACT CGGGATCTCG CGTACCGTCG CCGTCACAGC TTTCGAACAG 
CTTCTTGCCG AGGGCTTCGT CACAGGACGC ACCGGCTCGG GAACCTATGT CTCGAACGCC 
ATCTCGCCGG ACGTGCGCCC GAAGCGCTCC CATCCTGCGC GCATTGCGCT CTCGAAATAC 
GGGGTAGCGG CCGCGCAGGC CCGCGCTGCC GTCCACCTTC CCTCTCGCGC CGAGCGTCCG 
CTGCCACTCG ACTTCGCTGT CGGCTGCAGT GATCTCGAAA CGTTTCCCTT CGCGCTCTGG 
CGACGATTGC TGCTCCGTAG CGCACGCCGC ACCCGCGTCG CCGAACTCGA CTACGGTCCC 
CCCGAAGGTA ATTCGCAACT TCGGGAATTG ATCTGCACCC ACGTGCGTCG CGCGCGTGCC 
GTGCAGTGCG ACACCGATCA GGTCATCATC GTCAACGGCT CGCAACAGGC GATCGATCTC 
ATTTCTCGCG TGCTCTTAGA GCGTGGCGAT CCCGTGTGTA TAGAAGACCC CAGCTACCAG 
GGCACGCGTG AGGCCCTGCG CGTCGCCGGC GCTAAGCTCT TGCCGATCGC GGTGGACGCC 
GCTGGAATCA TCCCATCCAA GTTGCCATCA CGTGCGCGCC TGGCGTTTGT TACGCCGTCG 
CATCAGTTCC CCACCGGCGC AATTCTTCCT CTCGCACGGC GGATCGAACT TCTGCGCTGG 
GCGAAGCGCG CCAACGCCTT CATCGTGGAA GACGACTACG ACGGTGAGTT TAACTACGCC 
GGCAATCCAC TCGAATCGCT GCAGGGTCTG GATCGCGAAG GCCGCGTCAT CTACATCGGC 
ACCTTCTCGC GGACGATCTT TTCCGCGCTT CGACTCGGCT ATCTCATCGT CCCGAAGTCT 
CTGATCGCAG CTTTCTCCGC CGCAAAGTGG CTCTGCGATC GCCACAGCCC AACTCTCGAG 
CAGCAGACGC TCGCTGAGTT CCTCGCCGGA GGCCACTACG AGCGCTATCT CCGGCGCGTT 
CGCCAACGCA ACAGCAAACG TCGCGAAGTC CTGCTGGAGT CAATCGCCAA ACATCTCGGC 
TCACGAGTCA CTGTTACCGG ACAAAACGCC GGGGCCCACA TCGTCCTTTG GCTCAATCGC 
AATCGCAACG AAGACAAGCT CGTGCAGGCC GCCGCTGAAG TTGGTGTCCG CGTCTACGGC 
ATCGCGCCGT ATTACATCCA TCCACCGCGC GCTGCCGGAC TCATGCTGGG CTATTCCCGC 
CTACGCGAAT CCGAAATCGA AGATGGAATC CGTCGCCTCG CCCGCGTCCT CTAA

Protein sequence

MQFVIPLSRD QAPLFQQVYA GLRDAILTGK VPAGSRLPST REMATQLGIS RTVAVTAFEQ 
LLAEGFVTGR TGSGTYVSNA ISPDVRPKRS HPARIALSKY GVAAAQARAA VHLPSRAERP 
LPLDFAVGCS DLETFPFALW RRLLLRSARR TRVAELDYGP PEGNSQLREL ICTHVRRARA 
VQCDTDQVII VNGSQQAIDL ISRVLLERGD PVCIEDPSYQ GTREALRVAG AKLLPIAVDA 
AGIIPSKLPS RARLAFVTPS HQFPTGAILP LARRIELLRW AKRANAFIVE DDYDGEFNYA 
GNPLESLQGL DREGRVIYIG TFSRTIFSAL RLGYLIVPKS LIAAFSAAKW LCDRHSPTLE 
QQTLAEFLAG GHYERYLRRV RQRNSKRREV LLESIAKHLG SRVTVTGQNA GAHIVLWLNR 
NRNEDKLVQA AAEVGVRVYG IAPYYIHPPR AAGLMLGYSR LRESEIEDGI RRLARVL