Gene Acid345_2843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2843
Symbol
ID	4070362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3380777
End bp	3382558
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	59%
IMG OID	637984861
Product	thiamine pyrophosphate enzyme-like TPP bindin
Protein accession	YP_591918
Protein GI	94969870
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.89479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCCAGC CATACGTAAG CGAAACCCGC AACATTGCAA GCTATGCCGT AGATCTGGTG 
GCCGCACTCG GCTCCGACAC GGTCTTCAGC CTCACTGGCG GCATGGCCAT GTTCATGAAC 
CGCGCCGTTG CCACCCATAA ACGCCTGAAG CCGGTGTACT GCCAGCACGA GCAAGCTTGC 
GTCGCTGCGG CTGAGGGCTA CACCAAGGCC GCGGACTTTC GTCGCGCTGG CTTTGCCCTG 
ATCACAGCTG GCCCTGGCGT CTCGAACTCT GTGACCTCCC TGCTTTCTGC CTACGGCGAC 
TCTGCGCCGG TGATCGTTCT GGCCGGACAG ATCAAAACCG ACGACATTGA TCGCTTCGGC 
ACCCGCGCGC ACGGAATTCA GGAAGTGCCC TCGCAGGCAT TGATCACCCC ATGTGTGAAG 
AAGTTCGCTC GCGTGGATCC GCTGAACTAT CGAAAGCAAC TCGTAGAAAC GCTGGCGGAA 
GCATTCGCAG GACGCCCCGG CCCGGTCTTC ATCGAGATTC CGCTGGATGT GCAAGGTGCA 
CCGATCGAAT ACAGTGTCGA GACAATCGTC GCTGATCAAG CCGAGATAGA AAAACGAATT 
ATCGCTTCGC GCGACGCACA ACAGAGTCTG GCGCGAATCT CTGATGCACT CGGCGAACTT 
CTCAAGGCCA AGCGTCCGCT GCTCTATGTT GGAAATGGCT GCCGCATCGC GGGAGTAGAA 
GAAGCCGCCC GCACGCTGAT TTCCCGCTAC GATCTGCCCG CGGTTTTCTC CTGGCTCTCG 
TTCGATATCC TGGCCAGTCA AGATAAACAC TGGTTTGGCT GCCCGGGCGG ACTTGCGCCG 
ATCTATTCCA ACGAAGTGCT GGCGCGCGCC GACGTAATTC TCTTTCTCGG AGCGCGGCTT 
GATCTCGGCA CTACCGCTTT CCAACGCCAC GCTTTTGGGG ACCAGGCCCG GCGCCTGTTC 
ATCGACATAG ATCCCGCCGA GTTGGCGAAG TTCGCAGGTT TCCCGAATAC CAAGTGCATC 
GAAGCGGATC TGCATGCACT CCCAATCGCC GTCGAACAAC ACGCGACGAC GAACAGCGCA 
GCCGGAGAAG GCTGGCTGCA ATGGTGCATC GCTCGCAGAG ACCAATATCT TCCTGAAGAA 
CGCGAGCGCC TGCAGTCCAC GGAAATGACG GTGTTCGGCG TCGCTGAGCT TCTCTCGCGA 
TGGTCTGACG GCAAAGTGTT CGTACCCGCC AGTTCCGGCT ACGCGGAAGA AACTTTCTCG 
CGGTTCTTCG CGCCGGGTCA AGGCACGCGG TTCTTCAACG GGGCGTCGCT TGGATCTATG 
GGTTTGGGAT TGGCACACTC CATCGGCGCT TCGTTCGGCT CGCCGCGACG CGTGATCGGA 
CTCGAAGCCG ATGGCGGCCT GATGCTCAAC GTCCAAGAAC TCGCGACGTT GTCTCACTAC 
GCTCCGAAGG GCCACGTTCT CTTCGTGTTG AACAACGGCG GCTATGAATC CATTCGCGCT 
TCGCAGAGCC GCTATTTTGG CGCGGTGAGT GGCGTTGATG GCGAAACGGG GCTGTTCATT 
CCTGACCTCG CGAAGATCGC CGAAGCCTTC CAACTCCGCT ATTTGCGCGT AGATTCCCTC 
GCTGCACTCG ACGAGTTGCT TCCGAAGCTC GACCCGAATG ATCCGCCCAT ACTGGTTGAC 
CTCTGCGTTG CGCGCTTCGA AAATCGTGGG CCTTCGGTAA AGACCAAGAT CGGCGAGGAC 
GGGAAGCCCT ACACCACGCC GTTAGCGGAG CTATCGTGGT AA

Protein sequence

MSQPYVSETR NIASYAVDLV AALGSDTVFS LTGGMAMFMN RAVATHKRLK PVYCQHEQAC 
VAAAEGYTKA ADFRRAGFAL ITAGPGVSNS VTSLLSAYGD SAPVIVLAGQ IKTDDIDRFG 
TRAHGIQEVP SQALITPCVK KFARVDPLNY RKQLVETLAE AFAGRPGPVF IEIPLDVQGA 
PIEYSVETIV ADQAEIEKRI IASRDAQQSL ARISDALGEL LKAKRPLLYV GNGCRIAGVE 
EAARTLISRY DLPAVFSWLS FDILASQDKH WFGCPGGLAP IYSNEVLARA DVILFLGARL 
DLGTTAFQRH AFGDQARRLF IDIDPAELAK FAGFPNTKCI EADLHALPIA VEQHATTNSA 
AGEGWLQWCI ARRDQYLPEE RERLQSTEMT VFGVAELLSR WSDGKVFVPA SSGYAEETFS 
RFFAPGQGTR FFNGASLGSM GLGLAHSIGA SFGSPRRVIG LEADGGLMLN VQELATLSHY 
APKGHVLFVL NNGGYESIRA SQSRYFGAVS GVDGETGLFI PDLAKIAEAF QLRYLRVDSL 
AALDELLPKL DPNDPPILVD LCVARFENRG PSVKTKIGED GKPYTTPLAE LSW