Gene Moth_2311 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2311
Symbol
ID	3831425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2431273
End bp	2432184
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	57%
IMG OID	637830235
Product	hypothetical protein
Protein accession	YP_431141
Protein GI	83591132
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000000443541
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAGCCCA AACACATTTA CGCCCTGATC CTGGTAGCCT TGATCTGGGG GCTGACCTTC 
CCGGCCATGA AGATCGGTAG CTTCTACCTG CCGCCCTTAT CCTTTGCCGC CTGGCGGTTC 
TTCCTGGGGG CCCTCTGCCT GCTTCCCCTG GCCGGCAGGC GCCAGGGGAA ACTATGGCAT 
GCCGGCCGGG ATTTCTGGCC TTTATTTCTT CTCGGCCTCC TGCAGACGGC CATTATGGGC 
GGCGCTCTGC ACCTGGGTAT TAGCATGGTA AAGAGCGGTA TAACCTCGGT GGTTCTTTAT 
AGCTACCCCT TCTTCTTTAC CTTCCTGGCT TTTTTATTAC TCCGGGAACC CCTGACAGGG 
AAGCAAATGG CAGGCTTAAT TATCGGTTTC GCAGGTTTAA TCCTGGTCGT AGATCCCTGG 
AAGATGCATC CGACCCATGC TGAATTTATC GGGATCCTGG TCCTCCTGGG GGGGTCCATC 
GGCTGGGGCT TGGCCAGCGT TTACCTGAAG GCCGCCTTTA AAACCAGGGA TAAGCTGGAG 
GTTACCACCT ACCAGATGTT CTACGGGTCC CTGGTGTTGA TGCTGGTAGC GGCCTTCGCC 
GACCACGGCC TGCGCTTTTC CTGGACCGCC CCCGGTCTGG GCATCATGTT ATATACTGCC 
CTTCTAACCT CGGCCCTGGG TTTCGTTATC CTCCTGACCA TCCAGGCCCG CTATCCGGCC 
AGCCAGACCA GCGTTTATCT CTTCCTGGTC CCAGTCTTCG GCGTCCTCTT TAGTTCACTC 
CTACTGGGAG AGAAATTAAC CCTCAACCTT TTGCTGGGCC TGGCTCTGGT AGCAGCTGGT 
ATTATCACCG TCAACCTGGG GGCTCCGGTT CAGGCGCGGG AGAAGACCGA TTGTGTCGCA 
TCCGGCAAAT AG

Protein sequence

MQPKHIYALI LVALIWGLTF PAMKIGSFYL PPLSFAAWRF FLGALCLLPL AGRRQGKLWH 
AGRDFWPLFL LGLLQTAIMG GALHLGISMV KSGITSVVLY SYPFFFTFLA FLLLREPLTG 
KQMAGLIIGF AGLILVVDPW KMHPTHAEFI GILVLLGGSI GWGLASVYLK AAFKTRDKLE 
VTTYQMFYGS LVLMLVAAFA DHGLRFSWTA PGLGIMLYTA LLTSALGFVI LLTIQARYPA 
SQTSVYLFLV PVFGVLFSSL LLGEKLTLNL LLGLALVAAG IITVNLGAPV QAREKTDCVA 
SGK