Gene Moth_0491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0491
Symbol
ID	3832814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	504556
End bp	505833
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	62%
IMG OID	637828425
Product	hypothetical protein
Protein accession	YP_429364
Protein GI	83589355
COG category	[L] Replication, recombination and repair
COG ID	[COG1697] DNA topoisomerase VI, subunit A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGATCA GTAAATACGA AGGGAGCCGC TCTTTTCAAA CCGGCACCCC GGGCAAGCAG 
CGGCCCCAGT TCGCCATGAA GAAGAGCCCC CTGGCCGGCG ATTATTTTGA TGAGATGGAC 
CACCGCAAAA GGGAGGCCAT CCACGCCGCC CTGGCCGAAC TGGCGGCTGC CGGGGTGGTG 
GAGGTCACCT GGCCCCGCTT CCAGGAAGGC CGCCAGGTGG AAAAGGTGTA TTTGAACTTT 
GACGCCATCC CCCGGGCCTA TGAGCTGGCG GGGCTGGTGC CCAGGGCGGA ACGGATCTGC 
AGGCTGCGCC AGGTCCTGGC TCCCCTGGCT ACCCACCCCT GGGAGTGGGT GCGGCGATGG 
TGGGCCGGGG TGGACGCATC TTTAGGAGAA CGGCGGTCCG CAGGCCTGGA CCTGGAGGAC 
CCGGAAGGCT ACGGGGAACT GGTCAAGGTG CTCCTGGCCC TGCCGGGATT GGAAGACAGC 
ACACCGGAGC GCATCTTCAG CCAGCGGGTC CTGGGGGATT CCAAGGCCTT CGAGCAAAGG 
GTGAAAAAGC GGTTGCTGGC CCTGCTCAAG TCTTACGGTC CGGAGGAATA TGAAACCGAC 
GCCGAATATC TGGACAGCGT CGGCCTGACC GATAATCCCA AAATGGTCCT GGTGGCCGGA 
CCCATGACTT TCCGGGTGGG AAGGACCACC GTCAATGTGG GGGGACTTCC GGGCGGCCTG 
GGTCTGGCCG CTCATATGGT GCGGGCCATG GAGATAACGG CCGTTACCGC TCCTTGGGTT 
CTCCTGGTGG AGAATTTGAC CAGTTACTAT CAGGTTGTCC AAAGTGTAAG TGAGCTGGCT 
GTACCTTGCC GGGAAGGGGG AGGGGGCCGG GGTTTAGCGG TTGAGGGCCC TGCTGGCTTA 
GTAGTATATA CCGGCGGCTT CCCCCACCGC GGCGTGCAGC TTTTTTTACG CCGGCTCCAG 
GATTACCGGG AATCCCCTGG AGCCACCGCC AGGCCCCCGG TCTACCACTG GGGCGATATG 
GACTACGGCG GCATCCGCAT TTGCGAATAT ATCCGCCGCA ACTTAATTCC CGATTTGCAG 
CCCTACCTTA TGGATGTCAC TACTTATACC AGGTATTTGC CGGCCGGAAT ACCCTTCGGC 
GACGAGTATG CCGCCAGGCT CCGGCACTTG GCTGAGGACC CGGCTTACGC CCCCTGGCAC 
CCCCTCCTGC AGGCCATGCT GAAGCACCGC AAATGGGTGG AGCAGGAGAG CATTGCGATC 
AATGTAAGCT GGGCGTAA

Protein sequence

MLISKYEGSR SFQTGTPGKQ RPQFAMKKSP LAGDYFDEMD HRKREAIHAA LAELAAAGVV 
EVTWPRFQEG RQVEKVYLNF DAIPRAYELA GLVPRAERIC RLRQVLAPLA THPWEWVRRW 
WAGVDASLGE RRSAGLDLED PEGYGELVKV LLALPGLEDS TPERIFSQRV LGDSKAFEQR 
VKKRLLALLK SYGPEEYETD AEYLDSVGLT DNPKMVLVAG PMTFRVGRTT VNVGGLPGGL 
GLAAHMVRAM EITAVTAPWV LLVENLTSYY QVVQSVSELA VPCREGGGGR GLAVEGPAGL 
VVYTGGFPHR GVQLFLRRLQ DYRESPGATA RPPVYHWGDM DYGGIRICEY IRRNLIPDLQ 
PYLMDVTTYT RYLPAGIPFG DEYAARLRHL AEDPAYAPWH PLLQAMLKHR KWVEQESIAI 
NVSWA