Gene Cagg_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2042
Symbol
ID	7269201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2502035
End bp	2503003
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	59%
IMG OID	643566877
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002463366
Protein GI	219848933
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1089] GDP-D-mannose dehydratase
TIGRFAM ID	[TIGR01472] GDP-mannose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0017259
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGTCT TTATCACCGG CATTACCGGT CCGGTCGGCA GCTTTCTGGC TGATTACCTG 
CTGACCATAC CCGGTCTTGA TATTCACGCA TTCAAACGCT GGCGTAGCGA TCCGCGCCCG 
ATTGAGCATT TGCTGAGCAA GATCACGATT CACGAGGGCG ACATTGAGGA TGCTTTTTCG 
GTCGACCGCG CAATCGCTGC TGCCCGGCCC GACCGTATCT TCCACCTTGC CGCCCAGAGC 
TACCCTAGTG CGTCGTGGGA TGCACCGATT CTGACAATGC GAGCCAATGT AGAGGGCACG 
ATTAACGTGC TCGAAGCGGC CCGTCGTCAT GTGCCGCATG CCCGCATCCA CATTGCCGGG 
ACCAGTGCCG AGTATGGGCC GGTACGACCC GATGAGGTGC CGATCCGTGA GGAGCATCCA 
CTCCGCCCGG CCAGTCCCTA CGGCGTGAGC AAAGTCGCCG CCGAGCTGAG TGGTTTGCAA 
TATCACGCCA GCTACGGCCT GCACGTTGTC GTCACCCGCT CGTTCAACCA TGTCGGGCCG 
CGCCAGGGCG ACCGCTGCTC GATCCAGACC TTCTGCCGCC AGATGGCCTT GATCGAAGCG 
GGCCGGCAGT CACCAGTGAT CTATGTAGGT AATCTATCGC CGCGTCGCGA TTTTACCCAT 
ACCCGTGATG TAGCACGCGC ATTGTGGTTG TTGCTGGAAC ACGGCACACC CGGCGAGGTT 
TACAATCTCT GTTCGGGTCG AGCTGTACGT ATTGGCGATA TTGTCGATAT GGTGGTGGCA 
ATGGGGCGTG TGCCGGTGAC GGTACACGTT GATCCAGCGC GTTTGCGTCC GGTCGATGAA 
CCGATTTTAC AAGGCGACAA CAGCAAACTA CGTGCAGTCA CCGGCTGGCA GCCTGAGATC 
GGGATCGAGC AGATTGTGGC CGAGGTATTA GCGTATTGGC GGGCACAACT TGGCGTTCCA 
CGGTCGTAG

Protein sequence

MRVFITGITG PVGSFLADYL LTIPGLDIHA FKRWRSDPRP IEHLLSKITI HEGDIEDAFS 
VDRAIAAARP DRIFHLAAQS YPSASWDAPI LTMRANVEGT INVLEAARRH VPHARIHIAG 
TSAEYGPVRP DEVPIREEHP LRPASPYGVS KVAAELSGLQ YHASYGLHVV VTRSFNHVGP 
RQGDRCSIQT FCRQMALIEA GRQSPVIYVG NLSPRRDFTH TRDVARALWL LLEHGTPGEV 
YNLCSGRAVR IGDIVDMVVA MGRVPVTVHV DPARLRPVDE PILQGDNSKL RAVTGWQPEI 
GIEQIVAEVL AYWRAQLGVP RS