Gene Moth_1724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1724
Symbol
ID	3833024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1769934
End bp	1771142
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	52%
IMG OID	637829649
Product	transposase
Protein accession	YP_430569
Protein GI	83590560
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000337952
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.570095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTAG CCATGGATAA TATGCGCTTC TTCCGGGCCG GTCCCGCAGC CCTTATCTCC 
AGGTTATGTG ACGTCCTGAA GATAGCAGAA ATCATAGATG CCGTAGTTGA CTGGGACCCG 
GCCCAGTGCC ATCTTTCCCC GGGAAATCGG GTTAAGGCGC TGATCATTAA TCTCCTGGTA 
GACCGGGAGG CCCTCTATCA TGTGGAGCGC TTTTATGAGA ACCAGGACCT GGAGGTTTTG 
TTTGGAGCTG AGCAACAGGT CCGGCCTGAA GATTTTAACG ATGATGCTCT GGGCCGGGCC 
CTGGATAAAC TCTTCACCAG CGGCCAGCTG AAGAAGTTGT TCTCCAGCAT TGCTTTAACT 
GCCGCCGCCA CCCATAACGT ATCCATTGCG GGCATCCACG TCGATACCAC CTCCATTTCC 
GTGCAAGGAG CCTATGATGG TGAAGGAGAT TTAGATATCA CTTTTGGTTT TAGTAAAGAT 
CATCGCCCCG ACCTCAAACA GTTTCTCATC GGCTTGACCG TAAATAGAGA TGGGTTGCCC 
ATTTTGGCTC AGAGCTTGGA CGGCAATAGC AGTGATAAGT CCTGGTACCC CCAGGTTATA 
GAGGAATTGG TCCAAACCTT CAAGCCGGAA AAGCTTAAAG AGGTCATTTT CGTGGCGGAC 
TGCGCCCTGG TAACTAAGGA TAACCTGGCT CTTTTGGTTC AGGAGGAAGG TAACAAACCC 
GCCCTCCAGT TCATCTCCCT GTTACCGGAG AACTTCGGCC TTAACAAGGA GATTAAGGCT 
GAGGCCTTCC GCACCGGCAC CTGGCAGGAG ATCGGGAAAC TAAGCCCCAA GAAAGATGCT 
GCTTGCTATA AAAGCCAGAG CTTTGTCCGG GAAATAGACG GCCGCGATTA CCGGTTAATC 
GTGGTCCACT CCACAACCCT GGATAAGCGC AAAGAGAATA GTCTCTTGAA AAAGTGGGCT 
AAGCAAAGAG AAGTTCTGGA AAAGGCCGCC AAAGATCTTT CCCGCCGTCC CTTCGCCTGT 
AAGGCCGACG CCAGGAAAGC CATAGAACTC TTCTTGAGGG AATACCGCCA CCAACCTTTC 
ATCCTAAAGG GCACAGTTGA TGAAGAAATA GTGAGCAACT ACTATCAGGG GCCGGAGGTG 
ATTAGAGCCC TTGAACTTGC CGGCTTCGGT AAGGAAATAT ATCTTTTTCC ACCTCGCGGT 
GGCGGGTAG

Protein sequence

MPVAMDNMRF FRAGPAALIS RLCDVLKIAE IIDAVVDWDP AQCHLSPGNR VKALIINLLV 
DREALYHVER FYENQDLEVL FGAEQQVRPE DFNDDALGRA LDKLFTSGQL KKLFSSIALT 
AAATHNVSIA GIHVDTTSIS VQGAYDGEGD LDITFGFSKD HRPDLKQFLI GLTVNRDGLP 
ILAQSLDGNS SDKSWYPQVI EELVQTFKPE KLKEVIFVAD CALVTKDNLA LLVQEEGNKP 
ALQFISLLPE NFGLNKEIKA EAFRTGTWQE IGKLSPKKDA ACYKSQSFVR EIDGRDYRLI 
VVHSTTLDKR KENSLLKKWA KQREVLEKAA KDLSRRPFAC KADARKAIEL FLREYRHQPF 
ILKGTVDEEI VSNYYQGPEV IRALELAGFG KEIYLFPPRG GG