Gene Daud_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0401
Symbol
ID	6026435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	444535
End bp	445842
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	62%
IMG OID	641593245
Product	McrBC 5-methylcytosine restriction system component-like protein
Protein accession	YP_001716583
Protein GI	169830601
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.204424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTTG TGCCGGTAAT GCTTGGGGAA TGGGAAGAGC TGTCACCCAG CGGGGACAGC 
CCGACGAGGG GTCTGTCTTT CCGGCGGGAG CCGGCTGCCC GCGCATTGGC GGCCGACTTG 
GCCGAATCCG GGAAATTAGA GATCCGGGAA TTACTGAACG GCCTGGCCAT TCAGTCCAAG 
TCCTTTGTGG GCACCATCCG TCTCGGTCCG CTGCAAGTGA CCATCCGGCC CAAGATGACG 
GGTTTTCCGC TGGTTGCCCT GCTCCGCTAC GCCTACGGAT TGCGCAATCT CTTTCTTTAT 
GGACAGGTTG AGATGGAAAC AACGGATCGG CCTTTTCAAG ATTTGCTCCT GTCCCAATTG 
TCCGCCGAGG CGGCCGAATT ACTTTCCCGG GGTCTGCACC GCGCCTACCG GCCGCGACAT 
GAATTAATGG CCAGCCCGCG CGGCCGGGTG AACTTTCAAC GGTTGGCGCG TACGGGAGGC 
GTCCGACAGT CGGCATTGCC TTGCTATCAT CATCTCCGGC TCGCGGATTG TCTGTCCAAC 
CAGGTGCTGG TGGCCGGCCT GCGCTTCGGC GCCGGGTTGA CGGCCGATCT CGAATTGCGA 
GCGCGTCTCC GCCGGTTGGC GGCGGTATGC GGTGAGAACG TCACCCCGAT CCGTCTGGAT 
TACCACGTCT TCGCCCGGCT CGAACGGGAG GCCAATCGGC TGACCCGCGC CTACGAACCG 
GCTTTTCGGC TGACCAAGAT CCTGTACCGG GACGCCGGTG CGGGTTTGGG CCGGGAGGCG 
GGTGGACTTC CAGTTCCGGG ATTCTTGTTT GATATGAACC GGTTTTTCCA GGCCGTCCTG 
TCCCGTTTCC TGCACGAGAA TCTGGATGGT TTCCGGGTGC AGGATGAGTA CCGGCTGCAA 
GGCATGTTCG CCTACGTTCC CGGTTTTAAT CCGCAGCGCA GGCAGGCACC GGCCCCGCGC 
CCGGACTTCG TGGTTTTCCG CGGCGGCAGG GTAGCGGCGA TTCTGGACGC CAAGTACCGG 
GATCTCTGGG AAAATGCGCT GCCCCGGGAT ATGCTCTACC AGTTGGCGCT GTATGCGTTG 
AGCCAGGGCG GGGGCATGCG GGCCGCTATT CTTTATCCCA CTCTTGACCC CCGGGCGTGT 
GAGGCGGTAA TCGAGGTGCG GGAGCCGGTT CACGGTATGG GACGGGCGCA GGTGATCCTA 
CGCCCGGTGG TTATTGATGA ATTGGCGGAG ATGGTATCCC TGTCCGATCC GGCAACTGCA 
AGAAGGCGGA AAGAATACGC CCGTCATTTG GCCTTCGGCG AAAAATGA

Protein sequence

MTVVPVMLGE WEELSPSGDS PTRGLSFRRE PAARALAADL AESGKLEIRE LLNGLAIQSK 
SFVGTIRLGP LQVTIRPKMT GFPLVALLRY AYGLRNLFLY GQVEMETTDR PFQDLLLSQL 
SAEAAELLSR GLHRAYRPRH ELMASPRGRV NFQRLARTGG VRQSALPCYH HLRLADCLSN 
QVLVAGLRFG AGLTADLELR ARLRRLAAVC GENVTPIRLD YHVFARLERE ANRLTRAYEP 
AFRLTKILYR DAGAGLGREA GGLPVPGFLF DMNRFFQAVL SRFLHENLDG FRVQDEYRLQ 
GMFAYVPGFN PQRRQAPAPR PDFVVFRGGR VAAILDAKYR DLWENALPRD MLYQLALYAL 
SQGGGMRAAI LYPTLDPRAC EAVIEVREPV HGMGRAQVIL RPVVIDELAE MVSLSDPATA 
RRRKEYARHL AFGEK