Gene Acid345_2084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2084
Symbol
ID	4069683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2498220
End bp	2499218
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	59%
IMG OID	637984099
Product	pyridoxal-5'-phosphate-dependent enzyme, beta subunit
Protein accession	YP_591159
Protein GI	94969111
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.432383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0544348
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTCCC TTGAATCTTT CCGCCAAGCT CAAGAGCGTC TCCGCGGCAT TGCGGCGCGA 
ACCCCGTTGG TCCAATACTT CCCTCCCGGC CACACCCACA ACGACCGCAC TCTGCGCATC 
AAGCCAGAGT CGCTGCAGCC GATTGGCTCG TTCAAACTCC GCGGCGCTTA CAACAAGATC 
GCAACGCTTT CCGACGAGGA ACGTCAAAGA GGTGTAATCA CCTATTCGAG CGGAAACCAT 
GCGCAGGGCG TAGCCTATGG TGCGCGCGCC ATGGGTGTGA AGGCGTGCAT CGTAATGCCG 
CGCAACGCTC CCAAGGTCAA AATGGACGCG ACCAAGGCCC TCGGGGCCGA AATAGTAACT 
GTAGGACCAG CCAGCTCCGA GCGCCGTAAG AAGGCGGAAT CGTTGGCTCA GGAGCATGGC 
TACGCGATCG TCCCGCCCTA TGACGACGAA CAGATCATCT CCGGCCAAGG CACCGTCGGC 
ATGGAAATCT ACGAAGACCT CCCTGAGGCC GACATCGTAC TCGTCCCCAT TGGCGGCGGC 
GGTTTGATCA GCGGGGTCTC CGCAGCACTG AAGATGAGCG GCAGTAGGGC GAAGATCATC 
GGCGTCGAGC CCGAACTGGC CAACGACGCC CAGCAGTCGC TGCGAACCGG TAAGATCGTC 
ACCCTCCCTG CTGAGCGTGT TTCGAGTACC CTTGCCGACG GCCTCCGCAC TCAGTCCGTT 
GGAGATTTGA ACTACGAAAT CATCAAGCAA TATGTAGACG ACATCGTCAC GGTAGAAGAG 
GACGAAATCC GCGAGGCCAT GCGCCGCATG ATGAGCGAGT CGCGCCTCGT GGTTGAACCA 
AGTGGCGCCG TGACATTTGC TGCTTATCTC TTCCACGAAA AAGAGCTTCC TGCCGGCCGC 
AACGTGGTTG TCGTAATGAG CGGCGGCAAT ATTGAACCAT CGCTGCTCGC GCAAGTAATG 
ACCGAGTCCG ACGCGCAATC CGCGCAGACT GGGCGCTAG

Protein sequence

MVSLESFRQA QERLRGIAAR TPLVQYFPPG HTHNDRTLRI KPESLQPIGS FKLRGAYNKI 
ATLSDEERQR GVITYSSGNH AQGVAYGARA MGVKACIVMP RNAPKVKMDA TKALGAEIVT 
VGPASSERRK KAESLAQEHG YAIVPPYDDE QIISGQGTVG MEIYEDLPEA DIVLVPIGGG 
GLISGVSAAL KMSGSRAKII GVEPELANDA QQSLRTGKIV TLPAERVSST LADGLRTQSV 
GDLNYEIIKQ YVDDIVTVEE DEIREAMRRM MSESRLVVEP SGAVTFAAYL FHEKELPAGR 
NVVVVMSGGN IEPSLLAQVM TESDAQSAQT GR