Gene Acid345_3812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3812
Symbol
ID	4071096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4506702
End bp	4507706
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	637985835
Product	ADP-glyceromanno-heptose 6-epimerase precursor
Protein accession	YP_592886
Protein GI	94970838
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.284553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.244227
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCATCG TTACCGGTGG CGCCGGATTC ATTGGAAGCA ATCTCGTTCA TGAACTGAAT 
GCCGAGGGAA TCACCGACGT CCTTGTTGTT GACAATCTTG CAAATGCAGC AAAGTTTGAA 
AATTTGCTGG GCGCGAAATT CGCCGACTAC ATGGATAAAC GGGCCTTTCG AGCCGCAATT 
CGAGAGAGGT CGCTGGGAGC CCCGAAGATA GAGGCTATCT TGCATCAAGG AGCCTGTTCC 
AACACGCTAG AAGACGATGG CGTGTACATG ATGGACAACA ATTATCAGTG TACTAAGGAG 
CTCCTGCATT TCGCGATTGA ACAGGGAGCG CGCTTCGTCT TTGCTTCCAC GGCCGCCGTA 
TACGGGCTAG CAGGTCCTGG ACATTTTGCG CCAATTCCAG GGAATGAGCG TCCGCTCAAT 
ATTTACGGCT ATTCGAAATT AATGTTCGAC AATTATTTAC GCCATAAGAT AGCAGCAGAC 
GAAGTGTCAA TCACGGCTGT GGGTCTGCGG TACTTCAACG TCTACGGGCC GCGCGAGCGT 
CACAAAGGAC GTATGTCTTC AGTGATCCAT CATTTCACGG GACAGATGAA GAAAGAGCAG 
AAACTGCGGA TGTTCCAAGG ATCCGGCGGT TATGGAGATG GTGAACAAAG AAGGGATTTC 
GTATATGTCC GCGACCTCGC AAGGATGAAT TTATTCTTCG CGCAGCTCGG ACGTTTCGAG 
GCGGCTAAAG GCGAACCAGA GAGGACATAC CGTGGCATCG TCAACGCTGG CACTGGACTG 
AGCCGAAGCT TCAATGATGT CGCGGCTGCA CTAATGACGA TTCACGGAAA GGTCCCGGTC 
GAGTACATGC CGTTTCCATC CGATCTAATT GGTCGATATC AGCATTTCAC CGAGGCAGAC 
ATATCGGGAC TCCGCAAACT CGGCTGGATT GAGGAACCGA CCACGCTGGA AGCAGGCATC 
GACGAGACAT ACGCGACACT ACGGCAGTTG GGCCGCGAGT CTTGA

Protein sequence

MVIVTGGAGF IGSNLVHELN AEGITDVLVV DNLANAAKFE NLLGAKFADY MDKRAFRAAI 
RERSLGAPKI EAILHQGACS NTLEDDGVYM MDNNYQCTKE LLHFAIEQGA RFVFASTAAV 
YGLAGPGHFA PIPGNERPLN IYGYSKLMFD NYLRHKIAAD EVSITAVGLR YFNVYGPRER 
HKGRMSSVIH HFTGQMKKEQ KLRMFQGSGG YGDGEQRRDF VYVRDLARMN LFFAQLGRFE 
AAKGEPERTY RGIVNAGTGL SRSFNDVAAA LMTIHGKVPV EYMPFPSDLI GRYQHFTEAD 
ISGLRKLGWI EEPTTLEAGI DETYATLRQL GRES