Gene Apar_1213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1213
Symbol
ID	8414091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1358518
End bp	1359573
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	58%
IMG OID	645022807
Product	5-methylcytosine-specific restriction enzyme subunit McrC
Protein accession	YP_003180232
Protein GI	257785015
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.816052
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTCGGA TACAGAACAT CTACCACATG CTCGCCTACG CGTTCCAGAC GCTGCAGGGG 
CAGGGCTACC GCGACATAGC CGCCGAGGAG TTTGGAAACA CCACCGAGCT CCTCGCTGAG 
ATACTGGCGC GGGGTGTGAG CTTGCAGCTA AAGCGAGGCC TCGGTCAAGA GTATATCGAC 
CGCGAGGAGG CGCTCTCCTC CCCGAGGGGA AAGATAGAGC TGTCCGAGTC TCTGAAGACA 
CGCTCGATCC TGCGCAGGCA GCTGGTCTGC AGCTACGACG AGTTCAGCAC GGACACGCGC 
ATGAACCGCA TCCTCAAGGC GACGATTGCG CTCCTGGTCC GCTCGGACAT CGACAAGGTA 
CGCAAGAAGG CGCTCAGGCG GCTGCTACCG TACTTCGTGG ACGTGGGCGA CGTAGACCTT 
GAACATGAGG ACTGGCACAT GCGCTTCGAC CGGAACAATC AGGCCTACCG CATGCTCATG 
AATGTGTGCT GGCTGGTCGT GAAGGGCCTC CTCCAGACGC AGGAAGACGG AAGCATCCGC 
ATGATGGACC TCCTCGACGA GCAGCGCATG AGCCACCTGT ACGAGAAGTT CATCCTCGAG 
TACTACAGGC GCGAGCACCC GAAACTCTCC GCAGGGGCTC CATACATCGA TTGGGCTCTC 
GACGACGGCT TCGATGACAT GCTCCCCGCC ATGCACACTG ACATAATGCT CGAGCAGGGC 
AGGACTGTCC TCATCATCGA CGCGAAGTAC TACAGCCGCA CAATGCAACA GCAGTTTGAC 
AAGCGAAGCG TCCATTCGAG TAACTTGTAC CAGATCTTCA CCTACGTGAA GAACAAGGAA 
GTGGAGCTTT CCAGTACCCT CAAAGCCCAC AGTGTATCGG GCATGCTGCT CTACGCAAAG 
ACCGACGAAG AAATCCAGCC TGATGGCGTG TACCAGATGA GCGGCAACCA GATAAGCGTG 
AGGACGCTCG ATCTCAACCA GCCTTTCGAG GAGATACGCT CGCAGCTCGA TGGAATTGCC 
AAGGCACATT TCTCAAAGGA GGCAGCCTGT GTTTGA

Protein sequence

MIRIQNIYHM LAYAFQTLQG QGYRDIAAEE FGNTTELLAE ILARGVSLQL KRGLGQEYID 
REEALSSPRG KIELSESLKT RSILRRQLVC SYDEFSTDTR MNRILKATIA LLVRSDIDKV 
RKKALRRLLP YFVDVGDVDL EHEDWHMRFD RNNQAYRMLM NVCWLVVKGL LQTQEDGSIR 
MMDLLDEQRM SHLYEKFILE YYRREHPKLS AGAPYIDWAL DDGFDDMLPA MHTDIMLEQG 
RTVLIIDAKY YSRTMQQQFD KRSVHSSNLY QIFTYVKNKE VELSSTLKAH SVSGMLLYAK 
TDEEIQPDGV YQMSGNQISV RTLDLNQPFE EIRSQLDGIA KAHFSKEAAC V