Gene Cagg_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1920
Symbol
ID	7268835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2353331
End bp	2354371
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	643566757
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002463251
Protein GI	219848818
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.892292
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000398816
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGACC GTGTGTTAAT TACCGGTGGT GCCGGATTTC TCGGCATTAA TTTAGCGCGT 
TATTTGTTGG CGCGCGGCTA TATCGTGCGT TCACTCGATA TTGCGCCTTT CGACTACCCT 
GAGCGGAATC AAATTGAAGA GCATACCGGC GATATTCGTG ATCGGGCTGC CGTTGATCGG 
GCAATGCAAG GGGTGAGGTT TGTTGTCCAT ACAGCGGCTG CACTTCCGCT CTATTCACCG 
GCCGACATCT TCTCGACCGA TATTGATGGG ACACGCAACG TCCTCGAATC GGCCCGTGAT 
CACGGCGTCG AGCGGGTAGT CCATATTTCG TCAACGGCAG TGTACGGTAT TCCCGACCAT 
CACCCGCTGG TAGAAACCGA CCCGCTCAGT GGCGTGGGTC CGTATGGTGA GGCTAAAGTC 
AAAGCTGAGG AGCTATGTCT CGAATTCCGC AAGGCCGGGA TGTGTGTACC GATCTTGCGA 
CCCAAGTCGT TTGTCGGCCC TGAGCGACTC GGTATTTTTG CGATGCTGTA CGATTGGGCA 
ATGGAAGGAC ACAACTTCCC GTTGCCCGGA AACGGCAAGA ATCGCTACCA GTTGCTCGAT 
GTCGAAGACC TCTGTGAAGC AATCGTGCTC TGTCTGACGC TCGATCGCGA TCGGGTCAAT 
GACACCTTCA ACATCGGCGC GAAAGAGTTT ACCACGATCA AAGAGGATTT TCAGGCGGTA 
CTCGATGCAG CCGGCTATGG CAAGCGCATT ATCACCTTCC CGGCCAAGCC GATGGTGTGG 
GCACTGGCGA TCCTCGAAAA ACTGAAGCTG TCGCCGGTCT ACAAGTGGGC GTATGGTACC 
GTCACCGAAG ATTCGTTTGT GTCGGTCGAA AAGGCCGAGC GAGTGTTAGG CTTTACGCCC 
AAGTATTCCA ACAAACAGGC ACTGGTCCGC AACTATCAGT GGTATGTTGC AAACGCCAAG 
AAATTCGGTC AGCAGACCGG TGTCTCGCAC CGAGTGCCGT GGAGTCAAGG GATTTTGCGG 
CTGGCGAAGC TATTCTTCTA A

Protein sequence

MADRVLITGG AGFLGINLAR YLLARGYIVR SLDIAPFDYP ERNQIEEHTG DIRDRAAVDR 
AMQGVRFVVH TAAALPLYSP ADIFSTDIDG TRNVLESARD HGVERVVHIS STAVYGIPDH 
HPLVETDPLS GVGPYGEAKV KAEELCLEFR KAGMCVPILR PKSFVGPERL GIFAMLYDWA 
MEGHNFPLPG NGKNRYQLLD VEDLCEAIVL CLTLDRDRVN DTFNIGAKEF TTIKEDFQAV 
LDAAGYGKRI ITFPAKPMVW ALAILEKLKL SPVYKWAYGT VTEDSFVSVE KAERVLGFTP 
KYSNKQALVR NYQWYVANAK KFGQQTGVSH RVPWSQGILR LAKLFF