Gene Acid345_0329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0329
Symbol
ID	4070091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	357323
End bp	358366
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	59%
IMG OID	637982332
Product	LacI family transcription regulator
Protein accession	YP_589408
Protein GI	94967360
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.16025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.855853
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATTC GGGAGATTGC GAAGAGGGCA AAAGTTTCGA CCGCCACGGT CTCGCGGACG 
ATTAACCGCG TCCCAACCGT GGATCCGAAA CTGGCCAAGC GCGTCTGGCG GGTCGTTGAT 
GAGCTCGGCT ATTTCCCGAA CACCCAGGCG CGCGCCCTGG TGTCAGGGCG GAGCCGAATC 
CTCGGCTTGG TGGTCTCGGA AATCACCAAT CCGTTCTTCC CGGAAATCGT GCAGGTCTTC 
GAAAACATCG CTGTCCAGAA CAACTACGAG ATCTTGCTCA CCTCTACGGG GCACGATCCC 
GTGCGGATGG AAATCGCAGT CCGGCGGATG ATTGAGCACC GCGTGGAAGG TGTGGCACTG 
ATGACCTTCG GGATGGAAGA GTCGCTTCTG GAAAACCTGA AGCGGCGGAA AATTCCGATG 
GTGATTGTGG ACGTGGGGCC GCCGCGTCCG CTGGTGAGCA ATATCCGCGT GGATTACCAG 
CATGGCATAC GGCAGGCTGT CCAGCACCTC GCCGCTCTCC GACATCACAG GATCGCGTTT 
ATCTCAGGAC CGCTGCGGCT GCCATCGGCG CGGGCGAGGC TTGATGCGTT TAAGAACGCC 
ATGCACGAAC TGGACTTGCC GGCACATGAT GAGTTGTGGG TGGAAGGTAC GCATACCATC 
GAGGGCGGAG TCGAAGCTGC AGGGCGCCTG CTCTCGCTCC CCTCGCGGCC GACGGCAATT 
ATGTGCTCGA ACGACATGAC GGCGCTGGGA GTCATGCGCA AGAGCCACGA ACTCGGCATC 
CACATTCCGC ACGACCTCTC GCTCATCGGC TTCGACAACA TTCACATTTC CGAGTTCGTG 
CTGCCTCCGC TGACGACGAT AGAGATGTCT CAGGCGGAGC TGGCAACGCT GGCATTTAAT 
GCGTTACTCG CCGAGCTGCA ACGCAAAACG CCGAACCCGA ATGGAACGGA ATACGCGCTG 
GAGACACACC TGATCTTGCG CGAGTCCACC GCACGTCCAA AGCAGGAAGC GGATAACGCA 
AAGAAGAAAA AGGCCGCGCG GTAA

Protein sequence

MDIREIAKRA KVSTATVSRT INRVPTVDPK LAKRVWRVVD ELGYFPNTQA RALVSGRSRI 
LGLVVSEITN PFFPEIVQVF ENIAVQNNYE ILLTSTGHDP VRMEIAVRRM IEHRVEGVAL 
MTFGMEESLL ENLKRRKIPM VIVDVGPPRP LVSNIRVDYQ HGIRQAVQHL AALRHHRIAF 
ISGPLRLPSA RARLDAFKNA MHELDLPAHD ELWVEGTHTI EGGVEAAGRL LSLPSRPTAI 
MCSNDMTALG VMRKSHELGI HIPHDLSLIG FDNIHISEFV LPPLTTIEMS QAELATLAFN 
ALLAELQRKT PNPNGTEYAL ETHLILREST ARPKQEADNA KKKKAAR