Gene Moth_2344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2344
Symbol
ID	3832062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2464683
End bp	2465741
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	44%
IMG OID	637830267
Product	uroporphyrinogen decarboxylase
Protein accession	YP_431173
Protein GI	83591164
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.198374
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAATT ACCATGAGAT TTTAGCAACA GCAATGTTCA GACCCATAAA TCCCCATGTT 
CCCGTTGTAT TATGGGCTAT AGGGCAGACT TATGCCCCCT TTGCTAAAAT ACCGGATAAT 
GAGTACTATG CCGATCCGGC GAAAATGCTG GAAGCCCAGG TGAAGTTTTA CGAACGTTTC 
CCTGATGTAT TAACCATTCC CGGAATTTGG CCGGATCTTG GTCTGATGGC GGAACTGGGG 
GCTTTAGGAG CAGAGTTAGA GTTTCCGGAT GATGCCCCTC CTCAGTCCAG GGGTGGGGCC 
TTTGAAGATA TCAGGGAAGT AGAAAATTGG GAAGTCCCCG ATCCTAAAAA GGCGGATTAT 
ACCTCTCAGA CGCTAGATTA CCTTAAGTAT TTCTGTAAGC ATTTACCGGA AGAACCCAGG 
AAGAAGTGGG GATTCTTAGA TGGGCACATT TTCTGCGGTG GACCTGGTGA GATCTCAGGG 
TTATTACTCG GGTATGATAA ATTTTCTTAT GCAATGTATG ATTATCCGCA GCTCGTGCAT 
ATTCTGCTGC GTAAGGTAAC TGATTTTATT AAAAGCTATA TTGATGCCCA AATAGAAATA 
GTTGGGGAAC CTAAAAGGGT AATCATATGG GATCATATTC CCGGTATGTT GTCAAGAGAG 
CTTTTTGATG AATTTATCCA TCCTTATATG AAAGAGGTGT TTACCCATGT AGAAAAGGCG 
ACCCTGAGGA TATACCATAA CGAGAATAAT TACCCCCATC TCCTTGATTT AATGCGGGAT 
ATCCCGGCCA ACGTCTGCCA TATCGGCCCC AAACACGATC TGGTCGAGAG CAAAAGGGTT 
TTAAAAAAAT GTGTAATGGG AAACGTTCAT CCTATCCAGG AATTATTGCT GGGTACAAAT 
GAGGAAATTG AAGCAAAGTG TAAAACCATA ATTGAAACTG CAGGAAGAGG TGGCGGTTTA 
TGGCTTTCAA CCGGAGGCGG TATGGCCCCG GAAACACCGG TGGAGAAAAT GCAGGTCCTC 
ATTGACTGTA CTAAAAAATA TCTGCCACCT TCGCTGTAA

Protein sequence

MLNYHEILAT AMFRPINPHV PVVLWAIGQT YAPFAKIPDN EYYADPAKML EAQVKFYERF 
PDVLTIPGIW PDLGLMAELG ALGAELEFPD DAPPQSRGGA FEDIREVENW EVPDPKKADY 
TSQTLDYLKY FCKHLPEEPR KKWGFLDGHI FCGGPGEISG LLLGYDKFSY AMYDYPQLVH 
ILLRKVTDFI KSYIDAQIEI VGEPKRVIIW DHIPGMLSRE LFDEFIHPYM KEVFTHVEKA 
TLRIYHNENN YPHLLDLMRD IPANVCHIGP KHDLVESKRV LKKCVMGNVH PIQELLLGTN 
EEIEAKCKTI IETAGRGGGL WLSTGGGMAP ETPVEKMQVL IDCTKKYLPP SL