Gene Moth_1466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1466
Symbol
ID	3831352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1515256
End bp	1516365
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	52%
IMG OID	637829399
Product	periplasmic binding protein
Protein accession	YP_430319
Protein GI	83590310
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0440112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGAAAG TAATCTATAT TACTATAACC CTGTTTACTA CCCTATTTAT CCTGGCGGGT 
TGCGGCCCTC AAGCCCACCC GCCAGGGACA GCGCAGCCGA AGGTAAAAGT AACCGATCTG 
GTCGGCCGGG AGGTAGAGGT TACTGTTCCG GCAAATAAAG TGGTAGCCAT TGGCCCCGGT 
GCCCTGCGGC TGGTCTGCTA TGTAAATGGC GCAGGCAAAG TTGTGGGTAT AGAAAACCTG 
GAAAAGCAAC AGCCTGCTGG TAGGCCCTAT ATTTTAGCTT ATCCGGAATT AAAGGGTAAG 
CCGGTAATTG GCCAGGGTGG GCCTGATTCT ACCCCGGACG CGGAGAAACT GGCCAGCGTT 
CAACCAGACG TAATTTTTGC AGCCAGCCTG CTGGATAAAT CCCAGGCCGA CGAACTCCAG 
GCCAAGACGG GCGCCCCGGT GGTGGTGCTG AGTTACGGCA AGCTGGCCAC CTTTGATGAG 
GATGTGTACC GGTCGCTAGA GCTGATTGGC AGGATCATCG GCAATGAAAA AAGGGCGGGG 
GAAGTTGTCA CCTACCTTAA AAACTGCCAG CAGGACTTAA ATGCGCGGAC TAAGGGTATA 
CCTGCCGACA AGAAGCCCTC GGTTTATGTG GGCGCCCTGG GCATGAAGGG TACCCACGGC 
ATCGAGAGCA CCCAGGCCCA GTACCCGCCT TTCGTTGCTG TTAACGCCCG GAATGTAGTT 
GACGCTACCG GTAAAACGGG GAGCGTCATG ATCGACAAGG AAAAGCTTTT AAGCTGGAAC 
CCCGACATTA TTTTTATCGA TGAGGGCGGT TTAAATATCG TAGTCGATGA CTATAAGAAG 
AACCCCCATT TTTACCAATC CCTGGGCGCG TTTCAAAAAG GAAATGTTTA TGGCCAGATA 
CCGTATAATT ATTACACTAC CAACATCGAT ACTGCCCTTG CCGACGCTTA TTACGCCGGC 
AAAGTGATTT TCCCGGAGCA ATTTAAAGAC ATCGACCCGG CCAGGAAGGC CGATGAGATT 
TACCAGTTCC TCCTGGGTAA ACCTTTGTAT GAACAGATGG CCAGGGATTT TGGCGGGTTT 
AAAAAGCTGG ACCTGACAAA AGTGCCATAA

Protein sequence

MKKVIYITIT LFTTLFILAG CGPQAHPPGT AQPKVKVTDL VGREVEVTVP ANKVVAIGPG 
ALRLVCYVNG AGKVVGIENL EKQQPAGRPY ILAYPELKGK PVIGQGGPDS TPDAEKLASV 
QPDVIFAASL LDKSQADELQ AKTGAPVVVL SYGKLATFDE DVYRSLELIG RIIGNEKRAG 
EVVTYLKNCQ QDLNARTKGI PADKKPSVYV GALGMKGTHG IESTQAQYPP FVAVNARNVV 
DATGKTGSVM IDKEKLLSWN PDIIFIDEGG LNIVVDDYKK NPHFYQSLGA FQKGNVYGQI 
PYNYYTTNID TALADAYYAG KVIFPEQFKD IDPARKADEI YQFLLGKPLY EQMARDFGGF 
KKLDLTKVP