Gene Cagg_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1083
Symbol
ID	7268535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1340627
End bp	1341616
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	54%
IMG OID	643565928
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_002462433
Protein GI	219848000
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.135075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000927283
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGGAAT TACGGCTGAA TATTGCTACC CGTGAATGGG TAATCATTGC CAGCGAACGT 
GCCCGCCGTC CCAATGCATT CACCGAGACG CGACACCAAC CACGAACTGC CGAGCGTCCA 
CTGCACGATC CGCACTGTCC CTTCTGTGTT GGTAACGAAG AGCTTGACCT TGAAGTCGAA 
CGATACCCGG CGACCGGGCC GTGGCAATTA CGCATTGTTC GCAATAAGTA TCCGGCATTG 
CACGATCAGG GGCCGGTGAT GCGTCGTTTT GATGGTCTGC GACGCACTCT GAGCGGCTAT 
GGTTACCACG AGGTGCTGGT CGAGCATCCC CATCACAATA CAACGTTGGG GTTAATGACC 
AATGCCGAGG TAAAGGCTGT GCTGGAAATG TATCTGCGGC GTGGTCGGGC AATGAGTGCC 
GATCCGCGGG TAGAGCAGGT GGTTATTTTT AAGAATCACG GTGAACGGGC CGGTGCCTCG 
TTACAGCATC CGCATAGTCA ACTGATAGCT GTGCCGGTAG TCCCGGCTGA TGTTCGGCAT 
CGGATTGAGG AGGCGCGTCG GTTTTTTGAT GATACCGGCC AGTGTGTCTT TTGTGCAATG 
CTGGCCGATG AGCTGGCCAG TAACGAACGA TTGGTGTATG CAAACGATGA TTTTGTCGCG 
TTTGTGCTCT ACGCAGCCTC TTCCCCATTC CACATCTGGA TCTTGCCGCG TAGACATCGG 
GCTAGTTTTT TTCATATCGA TGAGACGGAA CTTGACGGTC TGGCCGATGT AGTGCGGGAA 
GTGTTTTATC GCCTCTACTA TCGCCTCAAC GATCCCGATT TTAATCTGGT GCTCCGCTCG 
ACGCCGGCCA AAGAGCCGGA GAATGGCTAT TTTCACTGGT ACCTGGCCGT TGTCCCACGG 
CTGTCGTATA TGGCCGGCTT TGAGATGGGG AGCGGTATTT TTATCAATCC CAGTATTCCC 
GAAGCCTGCG CCGCTTTTCT GCGTGAATAA

Protein sequence

MSELRLNIAT REWVIIASER ARRPNAFTET RHQPRTAERP LHDPHCPFCV GNEELDLEVE 
RYPATGPWQL RIVRNKYPAL HDQGPVMRRF DGLRRTLSGY GYHEVLVEHP HHNTTLGLMT 
NAEVKAVLEM YLRRGRAMSA DPRVEQVVIF KNHGERAGAS LQHPHSQLIA VPVVPADVRH 
RIEEARRFFD DTGQCVFCAM LADELASNER LVYANDDFVA FVLYAASSPF HIWILPRRHR 
ASFFHIDETE LDGLADVVRE VFYRLYYRLN DPDFNLVLRS TPAKEPENGY FHWYLAVVPR 
LSYMAGFEMG SGIFINPSIP EACAAFLRE