Gene Cagg_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1972
Symbol
ID	7268888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2409240
End bp	2410340
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	60%
IMG OID	643566809
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_002463302
Protein GI	219848869
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0237319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAC CCTTAAACAT CGTCACCATC GTCGGTGCAC GACCACAGTT CATTAAGGCC 
GCTGCCATCA GCCGCGCGTT GCGGACGCGG CACCGCGAGG TACTGGTGCA TACCGGGCAG 
CACTACGATG CCAATATGTC GGCGATCTTT TTTGACGAAC TGGGTATTCC GCCACCCGAT 
GTCAACCTAG CAGTCGGCTC CGCCGGTCAT GGCGCACAGA CCGGCGCAAT GCTGGCGAAG 
ATTGAAGAGG TATTGCTGGC GGAACATCCG GATTGGGTGT TGGTGTATGG CGACACCAAC 
TCCACGCTGG CAGGCGCGCT GGCGGCGGCA AAATTGCGCA TCCCCGTCGC CCACGTCGAA 
GCCGGGCTGC GCAGTTTCAA CCGTGCTATG CCAGAAGAGA TCAACCGCGT CTTGACCGAT 
CACATCTCAG ATCTGCTCCT TTGCCCAAGC CAGACCGCTA TCGACAACCT CGCGCGCGAA 
GGAATCACCC GCGGCGTTAT GCTGGTCGGC GATGTGATGG CGGACGCGCT GCGGTTGGCT 
GTTGAGCGCG CCGATGACTC GGCGCTGGCG GCGTTTGGCG TCCATCCGGG CAGCTATGCG 
CTCGCGACCG TCCATCGTGC CGAGAACACC GATGACCCGC TTCGCTTGCA AGGTATTTTG 
ACCGGTCTCA CACGACTAGA CATGCCGGTC GTCTTTCCGG TCCATCCGCG CACGCGCCGC 
GCGATCGCTG CGCTCGGATG GATGCCGCCT GCACACGTGC ATCTGATCGA ACCGGTTGGT 
TATCTGGACA TGATTGCGCT GATGCGTAGC TCGTGCGTTG TTCTGACCGA CTCGGGTGGG 
ATCCAGAAAG AAGCGTACTG GCTCGGTGTA CCTTGTATTA CCCTGCGTGA TGAGACGGAA 
TGGGTTGAGA CGGTTGAATA CGGATGGAAT ACTTTGGTCG GTGTCGATCC TGAACGGATC 
GTGGCCGCTG CCCACCGGCC ACGTCCGACA ACGCCGCGCC CAATACTCTA CGGCGATGGT 
CACGCCGCCG AACGGTGCGT GGCCGCGATT GAGAGAGGAT CGAAGGTTGA AGATGCAACT 
GTTGAAAATA GTGGTGTGTA G

Protein sequence

MSKPLNIVTI VGARPQFIKA AAISRALRTR HREVLVHTGQ HYDANMSAIF FDELGIPPPD 
VNLAVGSAGH GAQTGAMLAK IEEVLLAEHP DWVLVYGDTN STLAGALAAA KLRIPVAHVE 
AGLRSFNRAM PEEINRVLTD HISDLLLCPS QTAIDNLARE GITRGVMLVG DVMADALRLA 
VERADDSALA AFGVHPGSYA LATVHRAENT DDPLRLQGIL TGLTRLDMPV VFPVHPRTRR 
AIAALGWMPP AHVHLIEPVG YLDMIALMRS SCVVLTDSGG IQKEAYWLGV PCITLRDETE 
WVETVEYGWN TLVGVDPERI VAAAHRPRPT TPRPILYGDG HAAERCVAAI ERGSKVEDAT 
VENSGV