Gene Moth_1471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1471
Symbol
ID	3832352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1520473
End bp	1521792
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	51%
IMG OID	637829404
Product	diguanylate cyclase
Protein accession	YP_430324
Protein GI	83590315
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATAC AATGGCAGGA AACTTACTTC AAACTATTAC ACCAGTACAG TCTACAGCAG 
AGTGAGGCCA TCCTTTATGA AGCCTCCAAG CTTAGCAAGG CCCTGGTGGA GAAGGGTGTA 
GGCCCCGAAG ATATTGTTCA ATTTCACCTT GAGGCCCTGG AAAAGCTTTT CAAGGATATT 
TCGCCCCTCC GGGTACCGGG TCTGATTCTT ATTTCCTTTG ATCTACTGCT GGAAGTGATG 
ATGGCTTATG CTTTGAATTT CAGGGAATAT TTGGAAGTAA AAAACAAGCT CATTGAGCGA 
CTGGAAAACT TTAATCAAGA ATTGGCGGCT GCCAACCGTG CCCTGGAAAT GAAAGTCAAA 
GAGTTATCTG TTATCCAGGA ACTGACGAAA GAATTGGGAT CCTGCCTGGA CCTTGATCGG 
ACGGCCGGGA TAATCACCAG GCACCTGCAG GAATTGCTTA ATTGCGAAGT CAATCTATAT 
ATTATCAGTA GTAACGGTGA ATGGCAGGGC TATACCCCCG ATGATGACCC TGAGGCCGTC 
AGTATAAGCA AAAATATTGA TGTCCCGCCC CCGGTCCTGG AAGCCAGGGG CGGGGAGGCC 
GTCAGGGTGG AAGGTCGGGA CTTGACATTG CCCCTGGTAG TTGATCGGGA GGTTGGCGGC 
GCAATCTATT TACAAAGGGA CGATAGCTTC AGCGCCGACG AGTTTCGGCT GGCGGATATT 
ATCGCCGGCT ATGCTGCCCT GGCCATCGAG CGCGCCCGGC TGTATGAAGC CATGAAGTTC 
CAGGCAACCA TTGACGCCAA AACCGGTTTG TATAATTACC AGCACATGAT GCACCTGCTG 
GAAAAGGAGA TTGCCCGTGC CAGGCGTTAC CAGCGTACCT TTACCATCGC CATGCTTGAT 
ATCGATGACT TTAAAATTTA CAACGATACC CATGGTCACC ACCAGGGAGA CAAGGCCCTG 
CAGAAAATAG CGGCCCTCAT CAAGGCCAAC ATCCGGGAAG TAGATATAGC AGCGCGCTAT 
GGTGGCGAGG AATTTGTCAT TATCATGCCG GAAACATCTG CTTTAGAAGC GAGTGTAGTG 
GCCGAAAGGG TACGGCGAGC CATCATGAAT GCTGGTATCG CCAACGTAGG ATGCGGTCCG 
GACAGGCTGC TGACGGTAAG CATCGGCCTT GGTACTTATC CCCACGATGC CACGACGGCC 
GGGAAATTGA TTGACGCCGC CGATAGCGCC CTTTACGAAG CCAAGCGGTG GGGAAAGAAC 
GTAGTGCGGG TTTACAGTAA GACTGACAGG CGGCGATCCG GCGATGCAGA AGTACTTTAA

Protein sequence

MEIQWQETYF KLLHQYSLQQ SEAILYEASK LSKALVEKGV GPEDIVQFHL EALEKLFKDI 
SPLRVPGLIL ISFDLLLEVM MAYALNFREY LEVKNKLIER LENFNQELAA ANRALEMKVK 
ELSVIQELTK ELGSCLDLDR TAGIITRHLQ ELLNCEVNLY IISSNGEWQG YTPDDDPEAV 
SISKNIDVPP PVLEARGGEA VRVEGRDLTL PLVVDREVGG AIYLQRDDSF SADEFRLADI 
IAGYAALAIE RARLYEAMKF QATIDAKTGL YNYQHMMHLL EKEIARARRY QRTFTIAMLD 
IDDFKIYNDT HGHHQGDKAL QKIAALIKAN IREVDIAARY GGEEFVIIMP ETSALEASVV 
AERVRRAIMN AGIANVGCGP DRLLTVSIGL GTYPHDATTA GKLIDAADSA LYEAKRWGKN 
VVRVYSKTDR RRSGDAEVL