Gene Moth_1422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1422
Symbol
ID	3832250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1466771
End bp	1467772
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	44%
IMG OID	637829358
Product	periplasmic binding protein
Protein accession	YP_430278
Protein GI	83590269
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.158314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATAGAG CTATCAACAA AAAGTTGGTA ACTTTTTCGT TGATCAGTAT GCTGCTTTTA 
ATGACGTCTT TTATACTTGC CGGTTGCGGT AACCAGCAAA ACAAACCGCC GGCTGCAACG 
GAAAAAACGG TTATGGATAT GGCCGGTAAA AACGTAAAGC TACCGGCTTC CATAGACAGG 
GTGATTGTGA CCTGTTATGG CGGTGCCAGT CACGAGCTGG TAGTTCTGGG CGCCGGGGAT 
AAAATCGTTG CCCAGCCATC CATGAAAAGA TTTCCTCAAC TCGTGAAAAT GATGCCCCGC 
TTTAAAGATT TGCCGGATCC AGGTATTTTT GACAATGTCA ATATTGAGGC CATCTTAAAA 
TTAAAACCCG ATCTGGTTGT GGCCAGTGTA ACTTCAACGA AAGGCAATCA AAAAATTGAA 
GAAGCCGGTA TCCCGGTGAT TACCGTTAGT ACGGGCGTAG CGGATATTGA AGCTTTAAAA 
AAAGAGTTCC GGATGATGGG GGAGGTCTTG AATAAATCTA ACGAGGCCAA TGCGCTGGTA 
TCGTACTGGG ACAACTGGTT GAAGACCATC AAAGAGCGGG TGTCTAAGAT ACCTGAAGCA 
AAAAGAAAAA GAGTTTATTA CATGCTGGGA GCACCGCTTC ATACCAACGG CAGTGCCTGG 
TGGGGTCAAA CTTTAATTAC CGCTGCTGGT GGCCTCAATG TAGCCAGTGA GATTGGTAAA 
GGTAGAGATA TTAATATTGA ACAGCTTTTA ACATGGAACC CGGATGTAAT CATCATCAGT 
AGCAATGAAG GCCGCTTTAT TCCTATATCT GAAGTAAAAA ACAACCCTCA ATTCAAGGAT 
TTGCAGGCTG TAAAGGAGGG CCAGGCCCAA ATCCTTTACC CCGAAAACTT TCGTGATGTA 
GATTTGACTC AGGAAACGAT TAAGTTCTAC CAAACTTTTT ACCACTACAA CCTGACGGAA 
CAAGACGTTA AGGAATTTTT CAATCCCGGT CCTTTGCAAT AA

Protein sequence

MYRAINKKLV TFSLISMLLL MTSFILAGCG NQQNKPPAAT EKTVMDMAGK NVKLPASIDR 
VIVTCYGGAS HELVVLGAGD KIVAQPSMKR FPQLVKMMPR FKDLPDPGIF DNVNIEAILK 
LKPDLVVASV TSTKGNQKIE EAGIPVITVS TGVADIEALK KEFRMMGEVL NKSNEANALV 
SYWDNWLKTI KERVSKIPEA KRKRVYYMLG APLHTNGSAW WGQTLITAAG GLNVASEIGK 
GRDINIEQLL TWNPDVIIIS SNEGRFIPIS EVKNNPQFKD LQAVKEGQAQ ILYPENFRDV 
DLTQETIKFY QTFYHYNLTE QDVKEFFNPG PLQ