Gene Cag_0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0047
Symbol
ID	3747246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	52929
End bp	53915
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	53%
IMG OID	637772573
Product	methyltransferase
Protein accession	YP_378369
Protein GI	78188031
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0275] Predicted S-adenosylmethionine-dependent methyltransferase involved in cell envelope biogenesis
TIGRFAM ID	[TIGR00006] S-adenosyl-methyltransferase MraW

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.509185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACTGC ACGATACTTA TCACGATCCG GTGCTTGCGG CGGAGGTAGT TGCTACCCTT 
GTGCAGCGTT CGGGCATTTA CGTTGATGGC ACGCTTGGTG GTGGCAGCCA CTCCCTTGCG 
CTGTTGCAAG CCCTGCAAGC GCAAGGGTTG CTTGAATCAT CTTTACTGAT TGGTATTGAT 
CAGGATAGCG ATGCGCTGGC TATGGCTGCC GAGCGTTTAC AAGCGTGGCA ACCTTACACT 
CGCTTGCTGA AAGGGAACTT TCGTGATATG GCTTCGCTTG TTCAGCAACT CTGCGATGCT 
GAAGGGCGTG CTTGTGCCGT AACGGGCGTG TTGCTGGATC TTGGGGTCTC TTCGTTTCAG 
CTTGATACGG CTGAGCGTGG TTTTAGCTAC ATGCGTTCAG GTCCGCTTGA TATGCGTATG 
GATAACACGG CACCGCTTAC CGCGGCGGAG CTTATCAATC ATGCAGATGA AGCGGAGCTG 
GCGCGTATTT TTTATCACTA CGGCGAAGAG CCTCGAAGCC GTGCGTTAGC GCGTGCGGTT 
GTGCAGCAGC GCGAAAAAAT GGGCAATTTT ACAACCACCG AAGAGCTTGC AGCGTTAGTG 
CGGCGCTTAA CGCATGGTGG CGAAAAAGCT GTTATTAAAA CGCTTTCGCG CCTGTTTCAA 
GCCTTACGCA TTGCCGTGAA TGATGAACTT GGTGCTTTGC ATGAGGTGCT TGAGGGTGCG 
CTTGAGTTGC TTGATGGCAA CGGACGTTTA GCCGTTATGA GCTATCATTC GCTTGAAGAT 
AGGGTGGTGA AGCACTTTTT TACCCATCAT GCGCAATGCG ATTGGGGACC CAAAGGGGTT 
GCGTTACGGG AGCCACTAAG CCAAGGTGCC CTCACCATTG TTACCAAACG CCCCATGCTT 
GCCTCTGCCG ATGAAATTGA GCGCAATCCT CGCGCCCGAA GCGCAAAATT GCGAGTTGCT 
GCCAAAAATC AGCCAAAAAC CATTTAA

Protein sequence

MALHDTYHDP VLAAEVVATL VQRSGIYVDG TLGGGSHSLA LLQALQAQGL LESSLLIGID 
QDSDALAMAA ERLQAWQPYT RLLKGNFRDM ASLVQQLCDA EGRACAVTGV LLDLGVSSFQ 
LDTAERGFSY MRSGPLDMRM DNTAPLTAAE LINHADEAEL ARIFYHYGEE PRSRALARAV 
VQQREKMGNF TTTEELAALV RRLTHGGEKA VIKTLSRLFQ ALRIAVNDEL GALHEVLEGA 
LELLDGNGRL AVMSYHSLED RVVKHFFTHH AQCDWGPKGV ALREPLSQGA LTIVTKRPML 
ASADEIERNP RARSAKLRVA AKNQPKTI