Gene Moth_1953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1953
Symbol
ID	3832303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2030503
End bp	2031624
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	58%
IMG OID	637829884
Product	basic membrane lipoprotein
Protein accession	YP_430794
Protein GI	83590785
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0267127
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGTTGA TGTTGCTCCT GGCCCTGGCG GTGGCTGTCG CTGCCGTGGG TTGCGGCGGC 
CAGAAGCCGG CTGGCGAGAG TAAAAGCGGA GCTAATACGG CGAGCGGCGG GCAGGATCAA 
AACCAGAAAA TGAAGGTGGC CTTTGTTTAC GTAGGTCCAG TCGGTGATGC GGGCTGGAGC 
TGGGCCCACG ACCAGGGCCG GAAATACCTG GCGGAAAAGC TGCCCTGGGT GGAAACCACC 
TACATGGAGA ACGTACCTGA AGGGGCCGAC GCGGAGCGCG TCCTGACGGA GCTGGCCGAA 
CAGGGTAATA AGATAATTTT TGCCACCAGC TTCGGCTATA TGGACTACGT TATCAACGTG 
GCCAAGAAAT ACCCCAATGT CATCTTTATG CACTGCTCGG GCTACAAGAC GGCAGAGAAC 
GTCGGTACCT ACTTTGGCGC TATGGAAGAG GCCCGTTACC TCTCGGGTAT GGTGGCCGGC 
AAGATGACCA AGAAGAACGT CCTGGGCTTC GTAGCCGCCC ACCCCATCCC GGAGGTTATT 
CGCGGCATCA ACGCCTTCAC CCTGGGGGCG CGCTCGGTTA ACCCCAACGT GAAGGTCAAA 
GTAGTCTGGA CCAATACCTG GTATGACCCG GCCGCCGAGA AGCAGGCCGC CCTGAGCCTG 
CTGGATGCCG GAGCCGATGT CATCGCCCAG CACCAGGATA CCCCGGGCCC ACAACAGGCA 
GCCCAGGAGA GGGGCGCCTA CGGTATCGGC TATGACAGCG ATATGAGCCA GTTCGCTCCC 
AATGCCACCC TGACTTCGCC CGTCTGGAAC TGGGGTCCCT ACTATGTAAA GATAGTGGAA 
GCCGTCAAGA ACGGTACCTG GAAACCGGAG CAATACTACG GCACCATGAA GGACGGGATC 
GTCGACCTGG CGCCCTTCAA CAAGATGGTG CCCCAGGATG TCCGCGACCT GGTAGAAAAG 
AAGAAACAGG AGATCATTGA CGGCAAATTC TTCGTATTCC AGGGGCCCAT CAAGGACCAG 
AGTGGCAAAA TCCGGGTCCA GGAAGGCCAG AAGATGAGTC AGGAAGATAT CCTGGGCTTC 
AACTGGTTTG TAGAAGGCGT CGAGGGTGAA ATCCCGAAAT AA

Protein sequence

MLLMLLLALA VAVAAVGCGG QKPAGESKSG ANTASGGQDQ NQKMKVAFVY VGPVGDAGWS 
WAHDQGRKYL AEKLPWVETT YMENVPEGAD AERVLTELAE QGNKIIFATS FGYMDYVINV 
AKKYPNVIFM HCSGYKTAEN VGTYFGAMEE ARYLSGMVAG KMTKKNVLGF VAAHPIPEVI 
RGINAFTLGA RSVNPNVKVK VVWTNTWYDP AAEKQAALSL LDAGADVIAQ HQDTPGPQQA 
AQERGAYGIG YDSDMSQFAP NATLTSPVWN WGPYYVKIVE AVKNGTWKPE QYYGTMKDGI 
VDLAPFNKMV PQDVRDLVEK KKQEIIDGKF FVFQGPIKDQ SGKIRVQEGQ KMSQEDILGF 
NWFVEGVEGE IPK