Gene Moth_1383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1383
Symbol
ID	3831630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1429084
End bp	1430235
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	65%
IMG OID	637829319
Product	4Fe-4S ferredoxin, iron-sulfur binding
Protein accession	YP_430239
Protein GI	83590230
COG category	[R] General function prediction only
COG ID	[COG2768] Uncharacterized Fe-S center protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.581713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGAAAC TGGATCTGGA GACTATCGCC GCTACCCTGA CGGGATTGGG ACAGGTACGA 
GTGCAGGGAG ATGCCTGTAT CAGGGGGAAG TCACCCCGGG TAACTTGCCG GCGGTGCCAG 
GAAGTCTGCC CGGTAAAGGG TGTTGACCTG GGTAACGACC GGCCCGGGAT AAAGGATTGC 
CAGCGTTGTG GCCTCTGCGC TGTAGCCTGT CCTGTGGGGG CCCTGGAGGA TCCAGAGCGG 
ACCCACTCCT TTTTCCTGGC CCGGGGGCGG GAGAGTATAG TCGCCACCGG CAAAGCCCTC 
TTTGCCTGCA ACCGGGGACT GGCAGACCAC CGGCGGGATG GCTGGATAAT AGCTTCCTGC 
CTGGGGGCCG TCGCTCCGGA GGTAATCCTC GCCCTGGCTG TCAGGGGGCA AGTAGGTTTT 
CGCTACCTCC CGGAAGAGTG TGCCGGCTGC CCCTGGGGGG ACAAGGGAGA GCGACTCTTC 
CGCTCTTCTT TCGCCTGGGC CCAGCAGGCC CTGGGGGCTA TGGGTTTGCC CGGGGAGCGC 
CTGATCCGGG GAGGGTATCT CAAGCCAGCC CCGGCTCATG GTGGTGCAAC TGGCAGGGCC 
GGTGGCCCGG TCCCGGCGGT CATGGGCCGA CGCGAATTCT TCCGCTCCCT GGTATGCAAG 
ATCAAAATTC CTGGAGTAGA AATTACCCCG CTCTCCCAAT CTCCCCAGGC TGTGAATGCC 
AGGTCACGGG CCCTTATCCT GCAGCAGGCC CTGGAGGAGG CCAGGCCGGC AGGGGGTTAC 
CCGGCAACGG CCCGCTTGCC CCTGGCTGCC CTGAAAGTAA CCGGTCCCTG TTACCTCTGC 
AATATCTGCA GCCGGCTGTG CCCGACCGGG GCCCTGGAGT TGACGGAAGG GGAGTTGAGG 
TTTAACCCAT CCCGCTGCAA CCACTGCGGC CTTTGCCTGG CGGTATGCCC CCAGCACAGC 
CTGGCCTGGG GAGAGGACCT GCCTCTGGAG GCCATGGCAG CCGGGGCAAC CTGCACCCTG 
GCTATCGTCA CAAATCACCG GTGCGCCAGC TGTGGAGAAA CCTTCCAGGC CGGCGCTACA 
GCAATGGAAT GCCTGCGCTG CACCTTAAGC CGTGAGCTCC CCGGCGTGGC AGCCAGAAGG 
GGCGGGGCTT AA

Protein sequence

MGKLDLETIA ATLTGLGQVR VQGDACIRGK SPRVTCRRCQ EVCPVKGVDL GNDRPGIKDC 
QRCGLCAVAC PVGALEDPER THSFFLARGR ESIVATGKAL FACNRGLADH RRDGWIIASC 
LGAVAPEVIL ALAVRGQVGF RYLPEECAGC PWGDKGERLF RSSFAWAQQA LGAMGLPGER 
LIRGGYLKPA PAHGGATGRA GGPVPAVMGR REFFRSLVCK IKIPGVEITP LSQSPQAVNA 
RSRALILQQA LEEARPAGGY PATARLPLAA LKVTGPCYLC NICSRLCPTG ALELTEGELR 
FNPSRCNHCG LCLAVCPQHS LAWGEDLPLE AMAAGATCTL AIVTNHRCAS CGETFQAGAT 
AMECLRCTLS RELPGVAARR GGA