Gene Acid345_1612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1612
Symbol
ID	4072538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1954275
End bp	1955270
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	57%
IMG OID	637983621
Product	tagatose 1,6-diphosphate aldolase
Protein accession	YP_590688
Protein GI	94968640
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3684] Tagatose-1,6-bisphosphate aldolase
TIGRFAM ID	[TIGR01232] tagatose 1,6-diphosphate aldolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.697087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTTAA CCCCCGGAAA GCTTGCCGGA ATGAAGGCCG TATCGAATGA GCGCGGCGTG 
ATTGCTGCCG CCGCAATGGA CCAGCGCGGT TCGCTGAAAA AGGCGCTGGG CGCGAACGCG 
ACCGATCGCA ACCTGGAAGA GTTCAAGGAA ATCGTGACCG AAGTTTTGAC GCAGCATGCG 
TCGGCGATTT TGCTTGATCC TGAGTTTGGA TTGAGTGCGG CGAAGCATCG TGCGAAGAAC 
TCGGGTTTGC TGCTCGCTTA CGAGAAGACT GGCTACGACA AGCAGACGCC AGGACGCTTG 
CCTGATTTGC TTGATGTGTG GTCAGTGCGG CGGATCAAGG AAGCTGGCGG AGATTGCGTG 
AAGATCCTGC TGTATTACGC ACCGGCTGAT CCGAAGCGCA TCAACGATCA TAAACACGCA 
TGGACAGAGC GCATTGGCGA CGAGTGCCGG GCGAATGACA TTCCCTTCTT CCTCGAGATT 
ATCGGCTATG AAGAAGGCAT GGACGAGAAG GGCGTTGATT ACGCCAAGAA GAAGCCGGAA 
ATCGTGAAGG CTTACATGAA GGAGTTCTCG AACCCGCGCT ATGGCGTGGA CGTGCTGAAG 
CTCGAAGTGC CGATCAATAT GCAATTCGTG GAAGGCACGA AGTCGTTCAA GGGGCAGAAG 
GCGTACACGG TTGACGAAGC GAAGGAACAC TTCCGCGACT CGGCGAAGGC GACGAATTTG 
CCGTTCATCT ATTTGTCGGC AGGCGTGAGC AATGCGGAGT TCATCGAGAC GCTGGAATTG 
GTGTCAGGGA GCGGCGTGAA GTACAACGGC GTGCTCTGCG GACGCGCCAC CTGGAAGGAC 
GGGATTCCGA TCTACGCGCA GCACGGCGGC AAAGCCTTCC ATGAATGGAT CAGCACGGAA 
GGCGTGCAGA ACATCAATAA CGTGAACAAG GCGCTGGAGT CGGCGAGCTC GTGGTTCCCG 
ATTTATGGAG TGGAGAAGGC GGGAGCGGGG CGGTAA

Protein sequence

MTLTPGKLAG MKAVSNERGV IAAAAMDQRG SLKKALGANA TDRNLEEFKE IVTEVLTQHA 
SAILLDPEFG LSAAKHRAKN SGLLLAYEKT GYDKQTPGRL PDLLDVWSVR RIKEAGGDCV 
KILLYYAPAD PKRINDHKHA WTERIGDECR ANDIPFFLEI IGYEEGMDEK GVDYAKKKPE 
IVKAYMKEFS NPRYGVDVLK LEVPINMQFV EGTKSFKGQK AYTVDEAKEH FRDSAKATNL 
PFIYLSAGVS NAEFIETLEL VSGSGVKYNG VLCGRATWKD GIPIYAQHGG KAFHEWISTE 
GVQNINNVNK ALESASSWFP IYGVEKAGAG R