Gene Moth_1454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1454
Symbol
ID	3831340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1499828
End bp	1501063
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	56%
IMG OID	637829387
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_430307
Protein GI	83590298
COG category	[C] Energy production and conversion
COG ID	[COG1251] NAD(P)H-nitrite reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.534279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCA CAGACATTCT GGTTGCCGGT GGAGGTATTG CCGGGTGCAC CGCGGCGCTG 
GCTGCCAGGC GATACTACAG CGATAAAAAA ATCACCCTGG TACGCCGGGA AGTCAGGGCG 
CTGATGCCCT GGGGCCTTGC TTACGCCTGT GGTGCCGGGT CATTAAATGA GTATATCCTG 
GGCGACTCCC GGCTTTATAA AGAGGGAATT GAACTGGTAA TCGATGAAGT GACGGCCATT 
GATCCCGGGG GTAAACGGGT TACCACTGCC TTTGGTGAAA AAATAGCTTA CGATAAACTG 
ATCCTCGCCA TTGGTTCTTC GCCGGTCACT TCTTTACTTC AAGGAACGGA ACTCCCGGGC 
GTTTTTGTTT TGAAAAAAGA GCTTCCCTAC CTTAAAAGCC TTAAAGAGCA CCTGGCCAGG 
GCCAGGAACG TGGTTATCGT TGGTGGCGGG CTAAACGGCG TAGAACTGGC AGCGGCCTGC 
AGCGCCAACC ACCAGCTTCA CATCACCCTG GTAGAACAAC TACCCCATTG CCTGTCCGGG 
GTCTTTAATG ACGATACTTG CATTTTAATA GAAGAAAAAC TGCGCCGGAA GGGTGTTGCC 
ATTATAACCG GAGCGGCAGC GGAAGGACTG GAAGGCTGCC ATCGAGTAGA GGGTGTCAGG 
CTAACGGGTG GACGGACTTT ACCTGCTGAT GTGGTGGTCC TGGCCACCGG TATCGTACCC 
AATACCCTCC TGGCCCGGCA GGCCGGTCTG GCAACCGACG AAAATGCCGG CATCCTGGTG 
GATGAGTATA TGCAGACCAG TGCCACCGAT GTCTTTGCCA TCGGCGACTG CGCCGCTCAA 
AAATCCCTTG TCCCTACCGG CGGTTCTCTT ACCAGGCAGG CTGGACCGGC CGGCCACGAG 
GCCCGCGTAG CCGCCGCCAA CCTCTTCGGC CTGAAGCGAG CCAGGGAAAT TACTGTTAAG 
AAGATCTCTG TAGCTATCGG GGACCTGGTC TTTGGCTCCG TGGGCCTCAT AAAAATTTCC 
CTTGCGGAGA CCGGGACCGG AATGCCGACC ACCGCCCTTG CTCACGATGT GATCGCCAAA 
GATCTGGCGG TCAAGGTAGT TTATGTCCGG GAAACCGGGG CCACCCTGGG CGCTGAGGTC 
TACGGTAAAC CCCTCATCCG GGTGCGGGAA ACCATGAACA ATCTCGCGTC TGCTATTGAA 
CGGCAAACAC CCTTTGCCGG TCTGGCCCTG GCCTAA

Protein sequence

MKRTDILVAG GGIAGCTAAL AARRYYSDKK ITLVRREVRA LMPWGLAYAC GAGSLNEYIL 
GDSRLYKEGI ELVIDEVTAI DPGGKRVTTA FGEKIAYDKL ILAIGSSPVT SLLQGTELPG 
VFVLKKELPY LKSLKEHLAR ARNVVIVGGG LNGVELAAAC SANHQLHITL VEQLPHCLSG 
VFNDDTCILI EEKLRRKGVA IITGAAAEGL EGCHRVEGVR LTGGRTLPAD VVVLATGIVP 
NTLLARQAGL ATDENAGILV DEYMQTSATD VFAIGDCAAQ KSLVPTGGSL TRQAGPAGHE 
ARVAAANLFG LKRAREITVK KISVAIGDLV FGSVGLIKIS LAETGTGMPT TALAHDVIAK 
DLAVKVVYVR ETGATLGAEV YGKPLIRVRE TMNNLASAIE RQTPFAGLAL A