Gene Moth_1419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1419
Symbol
ID	3832247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1463564
End bp	1464691
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	55%
IMG OID	637829355
Product	periplasmic binding protein
Protein accession	YP_430275
Protein GI	83590266
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.364808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.918075
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAGC ATTTTACCTG TAAATTGGTC AGCCTGCTCC TGGCCATCTT GATCTTGACT 
GCCGCCCTGG TGGGTTGCGG CTCGCAAGGG AGTGGCCAGA AGGCAACCGG CCAGGCTTCT 
GCCGGTCAAG CAGCAGCTAA CAGGACTATA GTCGATATGG CCGGTCGCCA TATTACCGTC 
CCGGTCGAGA TCAAGAAGGT ATTTGCCACC AGCCCGGTGG GAACCATTCT GGTTTACACC 
CTGGCGCCGG AGAAACTGGC GGGATGGAAC TATGAGCTAA ATGAGGTAGA GAAGAAGTTT 
ATCCTGCCCG AGTACCAGAA GCTACCCAAT CTGGGCGGCT GGTATGCCAA GAATACGGCC 
AACATCGAAG AGATCCTGAG AATTCATCCT GAGGTTATCC TTTCTATGGG CTACATGGAT 
AACACGGCCC GTTCCCAGGC TGACCAGATC CAGGAGCAGC TTAAAATACC GGTGGTGATG 
GTTGACGGTG AACTGACAAA GCTGGACCAG GCTTATGAGT TTTTAGGCGA CCTGCTGGGA 
GAGAAGCAAA GAGCCAAGGA ACTGGCGGCT TATTGCCGGG ACACTATCAA TGAAGCTGCC 
GCTAAAGTTA AGGCGATGCC GGCGGACAGG AAGGTCCGAG TTTACTACGC CGAAGGTCCT 
ACCGGGCTGC AAACGGATCC CGCTTCTTCC CAGCATACCC AGGTGCTGGA TTTTATCGGC 
GGCATCAACG TGGCGGCCAT TCCACCCCAG CGCGGCCCAG GGGGCATGGG GATGAGCTCC 
GTCTCTTTGG AACAGGTGCT ATCCTGGGAT CCCGATGTGA TTCTCTTCTG GAACGTAGCC 
CAGGGAGGCG CCTACGAAAC TATCCTTAAA GACCCAAAAT GGCAGAACCT TAGAGCTGTG 
AAAAGCCACC GCGTCTACCA GGTTCCCCAC GGGCCCTTCA ACTGGTTCGA CCGGCCGCCC 
TCTGTCAACC GCATCATCGG GGTGAAGTGG CTGGCCAATC TCCTTTACCC GGATGTTTTT 
AATTATGACC TGGTGGCAAC GGTCAAGGAT TTTTATGCCA GGTTCTACCA CTATAACTTA 
TCCGATCAGG AAGCTGATAC CCTCCTGGCC GGGGCCAGGG GGAAATAG

Protein sequence

MFKHFTCKLV SLLLAILILT AALVGCGSQG SGQKATGQAS AGQAAANRTI VDMAGRHITV 
PVEIKKVFAT SPVGTILVYT LAPEKLAGWN YELNEVEKKF ILPEYQKLPN LGGWYAKNTA 
NIEEILRIHP EVILSMGYMD NTARSQADQI QEQLKIPVVM VDGELTKLDQ AYEFLGDLLG 
EKQRAKELAA YCRDTINEAA AKVKAMPADR KVRVYYAEGP TGLQTDPASS QHTQVLDFIG 
GINVAAIPPQ RGPGGMGMSS VSLEQVLSWD PDVILFWNVA QGGAYETILK DPKWQNLRAV 
KSHRVYQVPH GPFNWFDRPP SVNRIIGVKW LANLLYPDVF NYDLVATVKD FYARFYHYNL 
SDQEADTLLA GARGK