Gene Moth_1488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1488
Symbol
ID	3831715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1536408
End bp	1537370
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	60%
IMG OID	637829420
Product	ATP dependent DNA ligase, central
Protein accession	YP_430340
Protein GI	83590331
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02779] DNA polymerase LigD, ligase domain

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTA CCGGAGCCGG CCTGCCCCTG TTCCAGATCA GGCCTATGCT CGCCGTAATC 
AGCAGGCCCT TCGATTCCCC GGATTTCTTG TATGAAATAA AATGGGACGG CTATCGTTGC 
CTGGCCTACC TTGAGGGACA AACCCTCCTC CAATCCCGCA ACCTCCTGAA CATTACACCC 
ACCTTTCCCG AACTGGCCAG CCTCCACCAG CGGGTAAAAG GGCAACCGGC AGTACTGGAC 
GGGGAGATTA TCGTCCCCGG GAAGGATGGC AAGCCTTCCT TCAGCCTCCT CCAGGGGAGG 
GGCCGCCTGG GAGACCCCCT TAAAGTAAGG CAGGCGGCCA GGCGCATGCC GGCCATCTTT 
GTCGCCTTTG ACCTCCTTTA TTACCAGGGC GAAAACATTA TGCCGGAGCC CCTCCGCTGG 
CGCAAAGAAA GGCTTCAGGA GGCATTAGCG CCGGGGGAGA ACCTGATTGT CTCCAGTTTT 
ATTGAAAACT ATGGTATGAA GTTCTATGAG GCCTGTGTTG GCCAGGGGCT GGAAGGAGTG 
ATGGCCAAGG AACTGGACAG CCCTTACCTC CCCGGTAAAC GCTCACCCCG ATGGCGCAAA 
TTCAGGCACA CCCGGGCGGG GGAGTTTATT ATTGCCGGCT ATGAACCGGG AGCCGGCGGG 
CGTCTCCTGG GGTCCCTCAT CCTGGCGGAA TGCCGGGAGG GGCAGCTGGT TTACCGCGGC 
AAGGTGGGTA CAGGCTTTGA CCGGCAGGAG GAAAAGAAGT TGCTGGTAGA GTTGCAGCAG 
CTCCAGCCCG GGCCGCCGCC TTTTAAGGAA AACATCCCGG AGCTAAGGAA GCCCCGGTGG 
GTGCAACCCC GGCTGGTTTG TACGGTGGAG TACCTGGAGC TGACCCCGGA CGGCCGCCTC 
CGTCACCCCA CTTACCGCGG CCTGCGCTGG GATAAGGCTC CATGGGAATG CACCTCGACC 
TGA

Protein sequence

MTTTGAGLPL FQIRPMLAVI SRPFDSPDFL YEIKWDGYRC LAYLEGQTLL QSRNLLNITP 
TFPELASLHQ RVKGQPAVLD GEIIVPGKDG KPSFSLLQGR GRLGDPLKVR QAARRMPAIF 
VAFDLLYYQG ENIMPEPLRW RKERLQEALA PGENLIVSSF IENYGMKFYE ACVGQGLEGV 
MAKELDSPYL PGKRSPRWRK FRHTRAGEFI IAGYEPGAGG RLLGSLILAE CREGQLVYRG 
KVGTGFDRQE EKKLLVELQQ LQPGPPPFKE NIPELRKPRW VQPRLVCTVE YLELTPDGRL 
RHPTYRGLRW DKAPWECTST