Gene Moth_1028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1028
Symbol
ID	3832648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1058475
End bp	1059416
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	60%
IMG OID	637828956
Product	tyrosine recombinase XerD subunit
Protein accession	YP_429885
Protein GI	83589876
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID	[TIGR02224] tyrosine recombinase XerC

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00856798
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000634873
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGCCCGGAG TTACCTTTGG GGAAGCCCTG GAGGGTTTTC TTTTGTATCT AAAAGGCGAA 
AGGCAGGCTT CGCCCTGTAC CGTCGATGCC TACCGGGCTG ATATCGAACA ATTCGCCGCC 
TTCGTAGCAG GACGCGCGGG CCAGGAAGCA GGCCCTGCAG CAGTCGATAT CTGGATGGTG 
CGGCGCTACT TGGGCTGGCT GAACCAGCTG GGCCAGCAGC GGTCAAGCAT GAACCGTAAA 
CTGGCCGCGT TGCGTGCTTT TTATCGCTTC CTTCTACGGG CGGGGCAGGT ACAGAGCAGC 
CCCGTCGCCC TGTTATCCGG CCCCCGCCGG GAGAAAAGAT TGCCCGGCTG TCTGAGCCAT 
GCTGAAATGG AAAAACTCTT AAGTATCCCG GCGACTACTC CCCTGGGTTT GAGGGACCGA 
GCTATTCTGG AGACGCTCTA CGCCTCCGGT ATCCGGGTGG CTGAACTGGT AGGCATGGAC 
CAGGATGACC TGGATCTGGT AGCAGGTTAT GCCAGGGTCC TGGGTAAAGG CCGGCGGGAA 
AGGGTGGTAC CCCTTGGTCG CTATGCTGTT AAGGCCCTGG AGAATTATTT ACATCGGGCC 
CGTCCGGAAC TGGCCGCCCG GCGTATCCCT CCTGAACCCA GGGCCCTTTT CTTGAATCAC 
CTGGGGGGGC GGTTAACAAC CCGGGGAGTC CGGGAACGCC TGAGCCACTA CGTAGAAAAG 
GCCGCCCTGC GGAGGGGGGT TTCCCCCCAT ACTATCCGCC ACACCTTTGC TACCCACCTG 
CTGGAGGGAG GGGCGGATCT GAGGGTGGTC CAGGAACTCC TGGGCCATAT CCGCCTGGCG 
ACGACCCAGA TTTACACCCA CATCAGCCAG TCCCAGCTGC GTGAGGTTTA CCGCCAGTTC 
CACCCGCGGG CCAGCCGTGA TAATATAGAT AATCGAAGGT GA

Protein sequence

MPGVTFGEAL EGFLLYLKGE RQASPCTVDA YRADIEQFAA FVAGRAGQEA GPAAVDIWMV 
RRYLGWLNQL GQQRSSMNRK LAALRAFYRF LLRAGQVQSS PVALLSGPRR EKRLPGCLSH 
AEMEKLLSIP ATTPLGLRDR AILETLYASG IRVAELVGMD QDDLDLVAGY ARVLGKGRRE 
RVVPLGRYAV KALENYLHRA RPELAARRIP PEPRALFLNH LGGRLTTRGV RERLSHYVEK 
AALRRGVSPH TIRHTFATHL LEGGADLRVV QELLGHIRLA TTQIYTHISQ SQLREVYRQF 
HPRASRDNID NRR