Gene Moth_0383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0383
Symbol
ID	3832627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	387720
End bp	389132
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	46%
IMG OID	637828320
Product	anion transporter
Protein accession	YP_429260
Protein GI	83589251
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID	[TIGR00785] anion transporter

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCGA AAAATACAGC TGCTGGCTCG TACGGCAAAG TGTTAGCAGG TCTGTTAGCT 
ATTATTGTCT ACATTATACT GACAAATTTA CCCACTCCTG CGAATTTGCC GCCCCAAGGC 
CAAAAAGCCC TGGCCTTTAT GGTCGCTGTC GTGATCGTCT GGGTTTTTGA AGTCATTCCT 
ATCGGTATTT CCGCAGCTCT GTTCTTAATG ATTATGGATA TACTAAAGGT CTTCCCTATG 
AAGGATGCCA TGGCGAATTT TGCTACTACC ACTCTTTTCT TTATCTTATC AGCGTTTATT 
ATAGCCATAA CTTTCATCAA TACTGGGCTT GGGAACCGCG TTTCGTTAAT GGTGAGCGCT 
ATCTTTGGGC AGAAAACTGA TAGAGTCCTG CTGAGCTTTA TGTTACCTAC AGCTATTATT 
TCTAGCGTAC TAGCGGACAT TCCCACAGCT GTGATTTTTT CGAGTATAGC ATATCCTCTT 
CTACAGAAAA ATGGCTGCCT TCCGGGGAAG TCAAATTTTG GCAAGGCCTT GATGTTGGGG 
ATTCCTATTG CCGCAGCTAT TGGCGGTATT GCTACCCCTG CGGGTAGTGG TCTCAATATC 
ATGTCTATTT CACTCCTCAA GAACACGGCC GGCGTCGAGA TTAATTTTTT ACAATGGGCG 
CTTATCGGAT TTCCTATGGC AATCTTACTC ACCCTGGCAG CCTGGTATAT TGTGCTAAAA 
TTTTATCCGC CCGAATTTGA CCACGTACGG GGATTGGAAG ATATCGCGAA AGCCAGACAG 
GATCTTGGCC CTCTCACGGT CAACGAGAAA AAATTCATAG CCATCTTCTC CGTCACGTTG 
GTCTTGTGGT TTACTCAGCC ATGGAATCAT ATCGATCCCT CGGTAGTTGC TATTATCACG 
GCTTCCTCAT TTTTCCTGCC GGGAGTCAAA TTAGCAACCT GGGATGATGT CAAAGGAAAA 
TTGAGCTGGG ATGTTTTACT CCTACTAGGG ACTGCCAACA GTCTGGCCAT GGCGATTTGG 
CAGCTCAAGG GAGCTGCTTG GCTGGCCAAC ACGGTCCTGG GTGGATTGGC TGGTGTCGGC 
CTCCTGATAG TATTGTTCGC CGTTACAGCT TTCGGCATCT TCTCCCACTT AATTATACCT 
GTAGGTGGTG CCGTAGTGGC TGTAGCCATT CCGGTACTCG CAGTACTGGC TAAAAATACC 
GGGATCAATC CTGCCCTGCT AGTTATTCCA ATTGCGTATA CTGCGTCTTG TGTATTTTTA 
TTACCTCTGG ATCCCATTCC GCTAACCACA TATCATTACA AATATTGGAA ATTTTGGGAC 
ATGATGAAAC CAGGTTTCCT TATTTCCCTC GTCTGGTTGG TTTTAATGGT TATATTTATG 
TATATAGGAC AGGGCGTTGG AATAATACGA TAA

Protein sequence

MDAKNTAAGS YGKVLAGLLA IIVYIILTNL PTPANLPPQG QKALAFMVAV VIVWVFEVIP 
IGISAALFLM IMDILKVFPM KDAMANFATT TLFFILSAFI IAITFINTGL GNRVSLMVSA 
IFGQKTDRVL LSFMLPTAII SSVLADIPTA VIFSSIAYPL LQKNGCLPGK SNFGKALMLG 
IPIAAAIGGI ATPAGSGLNI MSISLLKNTA GVEINFLQWA LIGFPMAILL TLAAWYIVLK 
FYPPEFDHVR GLEDIAKARQ DLGPLTVNEK KFIAIFSVTL VLWFTQPWNH IDPSVVAIIT 
ASSFFLPGVK LATWDDVKGK LSWDVLLLLG TANSLAMAIW QLKGAAWLAN TVLGGLAGVG 
LLIVLFAVTA FGIFSHLIIP VGGAVVAVAI PVLAVLAKNT GINPALLVIP IAYTASCVFL 
LPLDPIPLTT YHYKYWKFWD MMKPGFLISL VWLVLMVIFM YIGQGVGIIR