Gene Acid345_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2108
Symbol
ID	4069534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2519446
End bp	2520747
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	61%
IMG OID	637984123
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_591183
Protein GI	94969135
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAGT TCGTAATTCG CGGCGGGACT CCGCTGCTTG GCAATGTGCG TGTAAGTGGC 
GCGAAAAACG CAGCCCTGCC CGCGATGGCG GCTGCCCTGC TTACTGAAGA ACCCGTCATC 
CTCGAAAATA TTCCGCAGGT ACGCGACATC ATCACCGAGC GCAATCTGCT GCAAGCGATG 
GGCGCGGAAG TCGAACTGGG CTATGGACGC GCGCATCACC GCACCACGCT TTGCTGCCGC 
AATCTCGTCA ACCCTGAGGC TTCCTACGAG CTGGTGAAAA CCATGCGCGC CTCGACGCTG 
GTGCTCGGGC CGCTCGTAGC TCGCACCGGC GAGGCACGCG TTTCCTTGCC CGGCGGATGC 
GCGATTGGGG CGCGCCCCAT CGATCTTCAC ATCAAAGGGC TGGAGAAGCT CGGCGCCGAG 
ATCACGCAGG AGCACGGTTA CATCAAGGCG AAGGCCACGC GCCTCAAGGG CAACCACATC 
GTCTTCGAAA AAATCACCGT GACAGGCACG GAAGACCTGC TGATGGCGGC GACGCTCGCC 
GACGGCGAGA CGGTGATGGA GAACTGCGCC CGCGAACCCG AAGTCACGGA CCTCGCACAC 
CTGCTGGTAA AGATGGGCGC GAAGATCGAG GGCATTGGAA CGTCGACGCT GAAGATCACC 
GGCGTTGAAA AACTCCATGG AGCGAAGCAC CGCATCATTC CCGATCGCAT TGAGGCCGGC 
ACATTCATCA TTGCCGGCGC GCTTACGGGC GGGGACTTGA TGGTGCAGAA CTGCGATCCA 
TCGCACCTCG GCGCGCTGTT GGCCAAGCTC GAAGAAAACG GCGTGAAGAT TCGCAGCAAT 
GGCGATTCCG TCCGGGTGAT GAGCGAGGGT ACGCTGAAGC CGGGCGACGC GAGCACAGAA 
GAATACCCCG GCTTCCCTAC CGACATGCAG GCGCAATACA TGGCGCTGGC GACGCAGTGC 
GAGGGAGCAT CGGTGGTGGT CGAGAACATA TTCGAGAACC GCTTCATGCA CGCGCAGGAA 
CTGGTGCGCA TGGGCGCGAA CATCAAGATC GAAGGCCGGC GAGCGATTGT CCGTGGCAAG 
ACGCCGTTGA GTGGCGCGGC TGTGCTGGCC AGCGATCTGC GAGCTTCGGC GTCACTGGTG 
CTGGCGGCGC TTGTCGCGGA GGGCGAGACG ATCATTGATC GCGTGTATCA CATTGATCGC 
GGCTACGAGC ACATCGAAGA AAAGTTGCGC GGTCTCGGGG CGGAGATCAA GCGCATCGGG 
GAATTGTTTC CGAAGAAAGC GTCGCCGGTG GCGGTGAGTT AA

Protein sequence

MDKFVIRGGT PLLGNVRVSG AKNAALPAMA AALLTEEPVI LENIPQVRDI ITERNLLQAM 
GAEVELGYGR AHHRTTLCCR NLVNPEASYE LVKTMRASTL VLGPLVARTG EARVSLPGGC 
AIGARPIDLH IKGLEKLGAE ITQEHGYIKA KATRLKGNHI VFEKITVTGT EDLLMAATLA 
DGETVMENCA REPEVTDLAH LLVKMGAKIE GIGTSTLKIT GVEKLHGAKH RIIPDRIEAG 
TFIIAGALTG GDLMVQNCDP SHLGALLAKL EENGVKIRSN GDSVRVMSEG TLKPGDASTE 
EYPGFPTDMQ AQYMALATQC EGASVVVENI FENRFMHAQE LVRMGANIKI EGRRAIVRGK 
TPLSGAAVLA SDLRASASLV LAALVAEGET IIDRVYHIDR GYEHIEEKLR GLGAEIKRIG 
ELFPKKASPV AVS