Gene Cagg_1379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1379
Symbol
ID	7267231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1705658
End bp	1707262
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	47%
IMG OID	643566222
Product	modification methylase NspV
Protein accession	YP_002462722
Protein GI	219848289
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGATC AACAACAACG CAAAGCCGAA TTTGGGGATT TTCAAACGCC CCTCAGCTTA 
GCCAGGGAAG TATGTTCCCT TATCGCTCGG ACTGGTTTTC GTCCCGCTTC GATTCTCGAA 
CCAACATGTG GGACGGGTTC GTTTCTCAAA GCATCTTTAG AAACATTCCC AGACGTATCG 
CGTGTTCTTG GCTTTGAGAT CAATCCGCAA TACGTGTTGC AAGCGCAGTA TGCTGTCACA 
CGCGCATTTC CTCATGCGTC CATTGAAGTT CATCAGTCTG ATTTCTTTCT CACGAGTTGG 
TCTGAGATTG TTAAAGCGTT GCCTGAGCCC ATTCTTGTTA TAGGCAATCC ACCCTGGGTG 
ACGAATGCAG CGTTGAGCAC TTGGGGCAGT AGCAATGTTC CGATGAAATC AAACCTCGAC 
AATCTCCCTG GTATTGATGC GCTCACCGGT AAGAGTAATT TCGACATTTC GGAATGGATG 
CTTAGAAAGA ACATCGAATG GCTGAATGGC AAAAACGTCA TACTTGCAAT GCTTTGTAAA 
ACGACAGTAG CACGTAAAGT TCTCTTGTAC GCTTGGCAAA ACGGTGTGCG GATCGAATCG 
GCATCACTTT ATACCATAGA CGCACAGGAG TACTTTAGAG CTTCGGTTGA CGCTTGCCTT 
CTGTTCATTC GAAGCAATCC GACCGGCAAT AGCAAAGAAT GCCAGGTTTT TCGTTCTCTT 
CATGCACAAC AACCCGATAG CTCGTTCGGT TTGCAGGATG GAATGCTTGT GGCTGATGTC 
AAATCATACC TGAAACGGAA AGACCTCACA GGGACAGGCT TTAGGGGCTG GCGGTCAGGA 
ATAAAGCATG ATTGCAGCAA AGTCTTTGAG CTGCGCATTG AACGTGGGAA TCTTGTTAAT 
GGCCTAGGAG AATTCGTTGA GATTGAACCT GAAGTGCTCT TTCCTCTGTT AAAAAGTTCT 
GATCTCGCAG CGCATAGGAA GCCGCATCGG TGGATGCTTG TTCCTCAACG GGCAATGAGT 
GACGACCCGA GCCGTCTTAG GTTGGACGTT CCCAAGGCCT GGAATTACCT TACTGCCCAT 
GCACATCTTT TGGACGAACG AAAGAGTTCA ATATACAGGA ACCGTCCGCG CTTCTCAGTC 
TTTGGAGTTG GACCATATTC ATTTGCTCCC TGGAAGATTG CTATTTCGGG TTTATACAAG 
AAACTTGAGT TTGTTCAAGT TCCACCTTTT CTGGGAAGCC CGGTGGTTCT CGACGACACA 
TGTTATTTTT TCCCATGTCA GTCTGAAGAA GAATGCAATC TATTGTACGA ATTGGTTACA 
TCCGAACCTG CCAGAGAGTT CTGGTCTGCA TTAATTTTCT GGGATGCAAA GCGGCCAATT 
ACGGCACAAC TTCTTAACTC ACTTGATCTG ATGGTTCTTG CACGCCTCTT GGGTAAGGAA 
TGTGATATAG CGCGAACTCT TGCGGAACGA CAGATTGTAG AATACACGGA AGGGGCTTTC 
CAGAGACTCC TTTTCAGAGA AGAAACTGCT GATTATGACG GTGAACCGGT TACAAACGAA 
TTCGATTTGC TAACCAATCA ACACATGCAT ACCGGGAAAC AGTAA

Protein sequence

MRDQQQRKAE FGDFQTPLSL AREVCSLIAR TGFRPASILE PTCGTGSFLK ASLETFPDVS 
RVLGFEINPQ YVLQAQYAVT RAFPHASIEV HQSDFFLTSW SEIVKALPEP ILVIGNPPWV 
TNAALSTWGS SNVPMKSNLD NLPGIDALTG KSNFDISEWM LRKNIEWLNG KNVILAMLCK 
TTVARKVLLY AWQNGVRIES ASLYTIDAQE YFRASVDACL LFIRSNPTGN SKECQVFRSL 
HAQQPDSSFG LQDGMLVADV KSYLKRKDLT GTGFRGWRSG IKHDCSKVFE LRIERGNLVN 
GLGEFVEIEP EVLFPLLKSS DLAAHRKPHR WMLVPQRAMS DDPSRLRLDV PKAWNYLTAH 
AHLLDERKSS IYRNRPRFSV FGVGPYSFAP WKIAISGLYK KLEFVQVPPF LGSPVVLDDT 
CYFFPCQSEE ECNLLYELVT SEPAREFWSA LIFWDAKRPI TAQLLNSLDL MVLARLLGKE 
CDIARTLAER QIVEYTEGAF QRLLFREETA DYDGEPVTNE FDLLTNQHMH TGKQ