Gene Cagg_3122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3122
Symbol
ID	7269540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3782184
End bp	3784094
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	60%
IMG OID	643567943
Product	magnesium chelatase ATPase subunit D
Protein accession	YP_002464416
Protein GI	219849983
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1239] Mg-chelatase subunit ChlI
TIGRFAM ID	[TIGR02031] magnesium chelatase ATPase subunit D

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACAAA GAGTGAAAGA ACTACCGACA GGGCCACTTC CCTTCACGGC AATCGTCGGC 
CTCGAAGCAG CCCGACAGGC CCTGCTCCTG TTGGCAGTCG ATCCGCTGCT GACCGGTGTC 
GCGATTGGTG CAGGAGCAGG TACCGGTAAA AGTGCGTTGG TGCGCGCCTT TGCCCGTATG 
CTGGCCGGTG GGCGTGAGTT TGACCCCACC TTACCCTGCA ATTTGGTCGA GATGCCGGTC 
GGCGTAAGCG AAGACCGACT CTTGGGTGGA ATTGACATCG AAGCAACTCT CGCGTTGGGC 
GAACGGGTCC ATCGGAGTGG CCTCCTCGCG CGCGCCAACG GCGGCTTGTT GTACGTTGAT 
AGCGTCAACT TGCTCGACGA TAGCACGATC AACCACATTC TCGGTGCGTT GGATAGCGGC 
GTGGTGCGGG TCGAGCGAGA AGGAATATCC GTTGTGGAAC CGGCCCGTTT TGTGCTGCTC 
GTCACATATG ACCCGGCGGA GGGGCCTCCT CGTCGCCATT TGCTCGACCG CCTAGGGTTG 
ATCGTAGCGC CGATCGGTAA AGCCCCGGTG ACGACGCGGG CCGAGGTTGT GCGTCGCAAC 
CTCCAACCCC ACCTCGATTA CGAAGATGAT GAGGCGCTGG TGTTAGCCGG CATTCTGGCG 
GCACGTGAAC TGTTACCCAA CGTCACCATC ACCGATGATC AGATTCGGCA ATTGAGTCTG 
ACAGCCCTAG CCCTAGGAAT CGAAGGGCAT CGGGCCGATA TGTTCGCGGT GCGGGCAGCA 
CGGGCAGCAG CCGCCCTGGC CGGACGTGAT GAGGTGAGTA ACGAAGACCT TGAGCTGGCC 
GTGCGGTTGG TGATGCTGCC GCGTGCTACA CGGCTACCAG AAATGACACC GGCAGAATCT 
CAACCACCAC CACCAACCCC AGAACCGGCC CCACCACCAC CGAGTCAGCA ACAAGAAGAC 
GACGAGCAGA ACAACGATGA CGATCAACCA CCGACGCCAC CAGACGAAGA GTTGACGGTC 
GAGGATCTCA TCCTGGCCGC AATGGAGACG GAAGTACCGC CGGACATCCT CGAAACGCCG 
TTTACCGTGC GCCGACGCGG GCGGAGTGGT TCACGTGGCA CCATTTCCGG ACAACGCGGT 
CGCCATATTC GCTCGGTACC GGGGAATCCG GCTCAAGGGC GGCTCGATGT GATTGCCACA 
CTCCGTGCCG CCGCACCGTG GCAACGGCTA CGAGCAAGTG ACCATCCGCC ACATCAGCAT 
CGGCGTGGAC GCATTCACTT GCGTGCCGAA GACTTACACA TCAAGAAATA CCGTTCTAAG 
GCGGGGACAC TCTTCTGTTT TCTGGTTGAT GCCAGCGGTT CAATGGCTCT GCACCGCATG 
CGACAGGCGA AAGGCGCCGT CAATTCCCTC TTGCAGCAAG CCTACGTTCA CCGCGATCAG 
GTGGCGTTGC TGGCTTTCCG TGGTGAGCGG GCCGATCTGC TCCTTCCTCC ATCACAAAGT 
GTCGAACTGG CCAAACGCGC CCTCGACGTG TTGCCAACCG GTGGAGGAAC CCCGCTCGCA 
GCGGCGCTAT TGGCGGCGTA CCAGATCAGT GAGCAAGCAC GGGCACGTGG TATTTTCCGC 
ACTACCATCG TGCTGATCAC CGATGGGCGA CCGAATGTAC CGCTTAAGGC CGATCCCACG 
ATGGACAAAA ATCGCCGGCT TGAGCAAGCT CGTCAAGAGG TACAGCAACT AGCCGGTCGG 
CTGCGCGCTG CCGGTGTCGG TGCTGTGGTC ATTGATACCC AGCGCAGTTT CGTTTCACGG 
GGTGAAGCCC AGCAATTGGC GGTATGGCTC GGTGGGCGCT ACGTATATCT GCCAAATGGA 
CGAGGGGATC AGATTGCAAA TGCCGTCATT GCGGCCAGCG AAGAGATGTA G

Protein sequence

MVQRVKELPT GPLPFTAIVG LEAARQALLL LAVDPLLTGV AIGAGAGTGK SALVRAFARM 
LAGGREFDPT LPCNLVEMPV GVSEDRLLGG IDIEATLALG ERVHRSGLLA RANGGLLYVD 
SVNLLDDSTI NHILGALDSG VVRVEREGIS VVEPARFVLL VTYDPAEGPP RRHLLDRLGL 
IVAPIGKAPV TTRAEVVRRN LQPHLDYEDD EALVLAGILA ARELLPNVTI TDDQIRQLSL 
TALALGIEGH RADMFAVRAA RAAAALAGRD EVSNEDLELA VRLVMLPRAT RLPEMTPAES 
QPPPPTPEPA PPPPSQQQED DEQNNDDDQP PTPPDEELTV EDLILAAMET EVPPDILETP 
FTVRRRGRSG SRGTISGQRG RHIRSVPGNP AQGRLDVIAT LRAAAPWQRL RASDHPPHQH 
RRGRIHLRAE DLHIKKYRSK AGTLFCFLVD ASGSMALHRM RQAKGAVNSL LQQAYVHRDQ 
VALLAFRGER ADLLLPPSQS VELAKRALDV LPTGGGTPLA AALLAAYQIS EQARARGIFR 
TTIVLITDGR PNVPLKADPT MDKNRRLEQA RQEVQQLAGR LRAAGVGAVV IDTQRSFVSR 
GEAQQLAVWL GGRYVYLPNG RGDQIANAVI AASEEM