Gene Acid345_3097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3097
Symbol
ID	4072661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3680939
End bp	3681907
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	60%
IMG OID	637985116
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_592172
Protein GI	94970124
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.675955
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTTT ACCTGGTGAC CGGCGCGGCC GGTTTTATCG GCCGTTCAAT TGCGCAGCAA 
CTGCTGGCAG GTGGCGCAGC GGTGCGCGGG ATCGACAATT TTTCGACGGG AAAACGCGGC 
AACCTCGTAG GACTCGAAGG GATGGAGTTC ATCGAGGGAG ATATCACCGA TCCGGCTGCA 
GTGGGGCGGG CTTGCGACGG AGTGGAGGTC GTGTTTCACG AGGCAGCGCT GGCTTCCGTT 
CCACGATCGG TTGCCGATCC GCTTGCCACC AACCACGCCA ACGTGACTGG GACATTGCAA 
TTGCTGCAGG CGGCGCATCG TGCCGGAGTG CGGCGCGTGA TCTACGCGGG TTCGTCGTCG 
GCGTATGGCG ATACGCCGAC CCTACCGAAG AACGAAGAGA TGCTGGCGAA TCCGATTTCG 
CCCTATGCGG TGTCGAAACT GACAGGCGAG TACTACCTGC GTTCTATGTA CGCGGTACAT 
GGAATGGAGA CGGTGACGAT CCGCTACTTC AATGTCTTTG GACCCTACCA GGATCCGGGC 
TCGCAGTACT CGGGAGTGCT GGCGAAATTC ATTCCGCAAA TGCTGCGCGG CGAAACGCCG 
ACGATTCACG GCGATGGCGA GCAGAGTCGC GACTTCACGT ACATCGAAAA CGTGGTGAAG 
GCGAACATTG CGCTGGCGAA TGCGCCGGCA GAACGGGTGG CAGGCGAAGT GTTCAACGTC 
GCTACCGGAA CTCGCATCTC GCTGAATGAA ACCGTCGCGT TGTTGCGCGA GATGACTGGA 
TATACGGGGG CGGTGCATCA TGGGCCGGAG CGCAAGGGCG ACGTGAAACA TTCGCTGGCG 
GACATCAGCA AGGCGAAGCG GGCGTTTGGA TTTGAGCCGA CCGTGATGTT CCCCGCGGGA 
TTGCATCGCA CGGTGGAGTG GTATCGGAAG GCGCTGGCGG AAGATGCGGT GGAGACGGCA 
CGAAAGTAG

Protein sequence

MALYLVTGAA GFIGRSIAQQ LLAGGAAVRG IDNFSTGKRG NLVGLEGMEF IEGDITDPAA 
VGRACDGVEV VFHEAALASV PRSVADPLAT NHANVTGTLQ LLQAAHRAGV RRVIYAGSSS 
AYGDTPTLPK NEEMLANPIS PYAVSKLTGE YYLRSMYAVH GMETVTIRYF NVFGPYQDPG 
SQYSGVLAKF IPQMLRGETP TIHGDGEQSR DFTYIENVVK ANIALANAPA ERVAGEVFNV 
ATGTRISLNE TVALLREMTG YTGAVHHGPE RKGDVKHSLA DISKAKRAFG FEPTVMFPAG 
LHRTVEWYRK ALAEDAVETA RK