Gene Cagg_1011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1011
Symbol
ID	7268383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1249782
End bp	1251008
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	56%
IMG OID	643565857
Product	MazG family protein
Protein accession	YP_002462362
Protein GI	219847929
COG category	[R] General function prediction only
COG ID	[COG3956] Protein containing tetrapyrrole methyltransferase domain and MazG-like (predicted pyrophosphatase) domain
TIGRFAM ID	[TIGR00444] MazG family protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACCA CACTCCATAC TGTGCTTCAT CTTGCGGTGA ATCAGGACCT GATCGACCCA 
GCAGCATTAC AGGTGTGGTC GGTTGAACGG TTGCTTCAAC CATCACCCCG GCCAACAGCA 
ACCAGGGTGT TACCATGGGT AGAACAGCAA GGTTTGGGTA GCTATCAACC GGTACGATTG 
CCATACCCCC TGGCAACACA TACCCCGGCT CTGATCTGGG GTGAACCGGC TACTCTCAAT 
CTGACCGCAC TGGCTACCCT TTTGGCTGAA CGTTACCCGA CCAACCATCG GTTGTTTGTG 
TTGACCGCAC CGGAGGGGAG TACGATACCG TTGACCGTGG CCGAACTCGC TACGGCAATC 
CTGCCACCAG ATGAAGTGAT CGGGATCGTT GTTCCGGCAT TGTCGCTTGC CGAAGACCAA 
CGGAGCCTTG ATCGATTGCG GTGGGTGATC GGTCGTCTGT GCGGGCCAGA CGGCTGCCCA 
TGGGATGTAC GCCAAACCCA TCAGAGCCTG CGGAGAACGT TCCTCGAAGA GGTGTATGAA 
GCGCTGGAAG CAATCGATAC CGGCGACATG CGTCACCTCT GTGAAGAGCT TGGTGATGTG 
CTGATGCAAG TATTCGTGCA TAGTGAAATG GCCCGCCAGG CCGGCTATTT TACCCTCGAA 
TCGGTCGTTC AGCACGTCGC CGATAAACTG ATCTTTCGCC ATCCGCACGT CTTCGGCACA 
ACCAGTGTGA CCGACACCGG TGAAGTTCTC CAAAACTGGG AGGCGTTGAA GGCGCAAGAA 
TTGGCTACTA AAGGCCAGGT ACGTAGCAGC GCGCTCGATG GTATTCCGTC AGCATTGCCA 
GCATTGGCCA CTGCCCAGAC GCTGGCGCGT AAGGCAATCC AAGCCGGGTT TACGTGGACG 
ACAATTGAGC AAGTTTGGGC CAAAATTGCC GAAGAACTGG CCGAGTTACG CGAAGCTGAT 
GATAGTGCGG CCCAGAAGCG GGAACTCGGT GATCTGCTGT TCGCGCTGAC CATACTGGCC 
CATTGGCTCC AACTCGATGC AGAATCGGCC CTGCGTGAAG CAAATCTGCG GTTTAAACAA 
CGGTTTCAAC AGGTCGAACA GATGGCTGCT CGTTCTGGAC GGAACCTGCG CGATTGCACA 
CTCGATGAAC TGATCGCATG GTGGACGGCA GCGAAGATGA TGAGGAACGA ACACACCGAT 
GGCACCACCA ATTCCGCTGT ACCGTAA

Protein sequence

MSTTLHTVLH LAVNQDLIDP AALQVWSVER LLQPSPRPTA TRVLPWVEQQ GLGSYQPVRL 
PYPLATHTPA LIWGEPATLN LTALATLLAE RYPTNHRLFV LTAPEGSTIP LTVAELATAI 
LPPDEVIGIV VPALSLAEDQ RSLDRLRWVI GRLCGPDGCP WDVRQTHQSL RRTFLEEVYE 
ALEAIDTGDM RHLCEELGDV LMQVFVHSEM ARQAGYFTLE SVVQHVADKL IFRHPHVFGT 
TSVTDTGEVL QNWEALKAQE LATKGQVRSS ALDGIPSALP ALATAQTLAR KAIQAGFTWT 
TIEQVWAKIA EELAELREAD DSAAQKRELG DLLFALTILA HWLQLDAESA LREANLRFKQ 
RFQQVEQMAA RSGRNLRDCT LDELIAWWTA AKMMRNEHTD GTTNSAVP