Gene Cagg_2150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2150
Symbol
ID	7267658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2640629
End bp	2641642
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	52%
IMG OID	643566982
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002463470
Protein GI	219849037
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000169098
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCGATC TGCAAACCCT ATCCGGCGCA CGAGTCTTGA TTACCGGTGG GCTTGGCTTT 
ATTGGCTCCA ATCTGGCGCA CAGGCTGGTT GAACTTGGTG CACAGGTCAC TCTCGTCGAC 
TCGTTGATCC CTGAATACGG TGGTAATCTC TACAACATTG CCGGTATCGA AGATCGAGTG 
CGCGTCAATA TTGCCGACGT GCGCGATGAG TATTCCATGA ACTATCTGGT ACAAGGGCAC 
GATATCCTGT TTAACCTCGC CGGACAGACC AGCCATCTCG ACTCGATGCG TAACCCCTAC 
ACCGACCTCG ATATTAACTG TCGTGCCCAA TTATCAATCC TCGAAGCCTG TCGTAAGCAC 
AATCCGCGAA TCACGGTAGT CTACGCTTCA ACCCGCCAAA TTTATGGCAA GCCCGATTAT 
CTGCCGGTCG ATGAACGCCA TCTGTTGCAT CCGGTTGATG TCAACGGTAT CAACAAAATG 
GCCGGTGAAT GGTACCACAT TCTCTACAAC AATGTGTACG GCATTCGGGC ATGTGCTTTA 
CGCCTAACGA ACACCTACGG CCCACGCATG CGGGTGAAGG ACGCGCGCCA AACCTTTCTC 
GGCGTCTGGA TCAGAAATGT GATCGAGGGC AAACCGATCC AAGTGTGGGG TGACGGCAAA 
CAACTGCGTG ACTTCACCTA TATCGACGAT TGTGTGGATG CACTGTTGTT AGCAGCTCTG 
CATCCGGCTG CAACCGGACA AATTTTTAAT CTGGGCGGTT TAGAGGTGAT TAATCTGCGT 
GATCTGGCAG CCTTAACGGT AGAAGTGGCC GGTGGCGGCA GTTTCGAGAT TATTCCCTAC 
CCACCCGACC GTAAGCCGAT CGACATTGGT GATTACTACG CCGATGATCG TCGTATTCGG 
CAGATGTTGG GCTGGCAACC ACGTATCGAT CTCCGTACCG GCTTAGCCCG CACGATTGCC 
TTCTACCGCG AACATCACCA ACACTATTGG GATTCGGTCG TGGAAGGAGT TTAA

Protein sequence

MIDLQTLSGA RVLITGGLGF IGSNLAHRLV ELGAQVTLVD SLIPEYGGNL YNIAGIEDRV 
RVNIADVRDE YSMNYLVQGH DILFNLAGQT SHLDSMRNPY TDLDINCRAQ LSILEACRKH 
NPRITVVYAS TRQIYGKPDY LPVDERHLLH PVDVNGINKM AGEWYHILYN NVYGIRACAL 
RLTNTYGPRM RVKDARQTFL GVWIRNVIEG KPIQVWGDGK QLRDFTYIDD CVDALLLAAL 
HPAATGQIFN LGGLEVINLR DLAALTVEVA GGGSFEIIPY PPDRKPIDIG DYYADDRRIR 
QMLGWQPRID LRTGLARTIA FYREHHQHYW DSVVEGV