Gene Acid345_2446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2446
Symbol
ID	4072881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2891676
End bp	2892665
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	57%
IMG OID	637984463
Product	ThiJ/PfpI family protein
Protein accession	YP_591521
Protein GI	94969473
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTCG TTCCGCAGGG AGGCAGCGCT GACGCGTTGC CCACCGTGAC CATTCTGTTA 
TTTAACGGCG CTCAACTCAT AGACTTCGCC GGTCCTTGGG AGGTGTTTGG GACAGCCGGA 
TTGCTGGTCC ACACGGTGGC CGAAAAGGCA GAGCCACTTA CTGCGGTTTT CGGAGCAAAG 
ATCATCCCTG ATTACACCTT CGAAAACAGC CCAAGGACGC ATCTGCTTCT GATTCCTGGA 
GGCGGTGTTT TTCAAGAGGC CATTAAGAAT CCGGCCTTGA TTCACTGGAT CCAGACGAAG 
GCAACAGAAG CAAAGGTCGT GATGTCCGTT TGCACCGGTG CATTCCTTCT GCAAGCCGCA 
GGGTTGCTCG AGGGACATAC CGTGACAACG ACCTACGGAA TGATCGATGA CCTCTCCGGC 
CCGAAAACCA AAGTCGTTTA TGACCGGCGG TTCGTGGAAA GCGGCAATCT GATCACCACC 
GCGGGATTGT CCTCTGGCAT TGACGGCGCT CTGTATGCTG TGTCTCGGCT TCTCGGCAGC 
GGCATAGCGC AAAGCGTGGC ACTGGAAATG GAATACAACT GGGATCCAAC CGGCAACTAT 
GCGCGCGCGG CCCTCGCCGA CCGCTTCCTG CCAGACGGTC TCGCGTACGC CAAACCTCGA 
ATCAAAGGCG CACAAGCCAA GATGATCTCC ACAGCTGGTG ACCGAGATCA GTGGGAAACG 
AAAATTGTCG TGTCACATCC TGAGACGGTG AGCGAAGTTC TCGAACTGAT GCGGGCGCGG 
ATCAAGGCAA ACACTGCAAC CGGCGGGATG TTCAAGCCGG TTTCCCACAT CCACGGACCT 
CCGCAGGTGA GTGTTGCGGG CGGCGGAAAA TTGACGTGGA AGTTCACCGA CGACGACAGC 
CAGCAATGGA GTGGTGAGTG TACGGTCGAA CCCTATGAAC AGCGAGTCGA CCGCCTGCTG 
GTGACGATCC GCGTTGCTCG AGCGAAATAG

Protein sequence

MTLVPQGGSA DALPTVTILL FNGAQLIDFA GPWEVFGTAG LLVHTVAEKA EPLTAVFGAK 
IIPDYTFENS PRTHLLLIPG GGVFQEAIKN PALIHWIQTK ATEAKVVMSV CTGAFLLQAA 
GLLEGHTVTT TYGMIDDLSG PKTKVVYDRR FVESGNLITT AGLSSGIDGA LYAVSRLLGS 
GIAQSVALEM EYNWDPTGNY ARAALADRFL PDGLAYAKPR IKGAQAKMIS TAGDRDQWET 
KIVVSHPETV SEVLELMRAR IKANTATGGM FKPVSHIHGP PQVSVAGGGK LTWKFTDDDS 
QQWSGECTVE PYEQRVDRLL VTIRVARAK