Gene Cagg_3603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3603
Symbol
ID	7269747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4379112
End bp	4380239
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	59%
IMG OID	643568411
Product	pyruvate carboxyltransferase
Protein accession	YP_002464877
Protein GI	219850444
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02146] homocitrate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.109467
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTGC CTGAGCGCCT GTTTTTTGTC GATACCACCC TGCGCGAAGG CGAACAGTTC 
GCCAGCGCCC GCTTTACGTC CACCCAACGG CTTGCTATCG CAGAAATGCT CGACGCATTC 
GGCGTTGAGT ATATCGAACT CACCTCTCCG GCAGCTTCGC CGCAAAGTGC GCGTGATCTC 
GCCACCATTG CCCGTCGCGG TCTCCGCGCC CGTATCCTCA CCCATATCCG CTGTCACATG 
GCCGATGCAC GCCTCGCCGT CGAACACGGT GCGCAAGGTG CGAATCTGCT CTTCGCTACG 
TCCGAACCCC TACGCACGGT GAGCCACGGA CGCAGCCTCG ATGAGATTTT GGCTGAAGCG 
CAACAGGTGA TCACTTACCT GCGCGACCAC GACGTCGAGG TGCGCTTTTC GTGTGAAGAT 
AGTTTCCGCA CCGACCTTGC CGACTTGATC CGCATTTACC GCGCGGTCGA GACGATGGGC 
GTCCAACGGA TCGGTCTTGC CGATACCGTT GGCATCGCTA CGCCGCGTCA AGTCTATGAA 
GTGGTTAGCG CTGTGCGTGC TGAAGTCACA TGCGACATCG AATTTCACGG CCACAACGAT 
AGTGGCTGCG CAGTCGCCAA TACCTTCTGC GCTTACGAAG CCGGTGCGAC CCACCTCGAT 
GTGACGGTAC TTGGGATCGG TGAACGCAAC GGTATTGCCA GTCTAAGCGG GATGATTGCA 
CGGATTGCGA GCGTCGATCC GGATCGTGTT CGGCGGTATC GTCTCGATCT GTTGCCTAAG 
ATCGACGAGA CGGTAGCAAC CATGCTCGGC ATCGAAATCC CATTCAACCA GTGCATTACC 
AGTCCGACCG CTTTTCACCA CAAGGCCGGG ATGCACACGA AAGCCGTGCT GGCCGATCCA 
CGCAGCTACG AAGTGCTCGA TCCGAACCTG TTCGGTCGCC AGCGCACCAT TGCGATTGCC 
CACCGGTTGG TGGGGTGGCA CGCCGTCGCC GAACGCGCCC GCGAACTGGG TATCACCCTC 
AGCGAAGCGC AAGCCCGCGC CGCCGCCGCC CGCATTAAAG CTCTCGGCGA CGAACACGAC 
CTTGATGGCG CAATGATCGA TGAGATTCTT TATAGCTACG CCGAATAA

Protein sequence

MSLPERLFFV DTTLREGEQF ASARFTSTQR LAIAEMLDAF GVEYIELTSP AASPQSARDL 
ATIARRGLRA RILTHIRCHM ADARLAVEHG AQGANLLFAT SEPLRTVSHG RSLDEILAEA 
QQVITYLRDH DVEVRFSCED SFRTDLADLI RIYRAVETMG VQRIGLADTV GIATPRQVYE 
VVSAVRAEVT CDIEFHGHND SGCAVANTFC AYEAGATHLD VTVLGIGERN GIASLSGMIA 
RIASVDPDRV RRYRLDLLPK IDETVATMLG IEIPFNQCIT SPTAFHHKAG MHTKAVLADP 
RSYEVLDPNL FGRQRTIAIA HRLVGWHAVA ERARELGITL SEAQARAAAA RIKALGDEHD 
LDGAMIDEIL YSYAE