Gene Moth_1588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1588
Symbol
ID	3832734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1621898
End bp	1623517
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	57%
IMG OID	637829517
Product	Cl- channel, voltage gated
Protein accession	YP_430437
Protein GI	83590428
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0038] Chloride channel protein EriC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000108225
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.782392
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTG TGGAAACTGT ACTGCAGGAG CATTCGGTAC CAGAGGGTAT ACTATTAAGA 
AGATATAGTT ACCTTCTTCG CTTTTTATGT ACGGGAGCCC TGGCGGGAGC GGGCGCCGGA 
CTGGTGGGCG CGGCCTTCAG GCTGGCCCTG ACGGAAGGGG ACTTATGGCG TAATAGCCTC 
TTGACATGGG CCAAGGGAAT ACCGCTGTGG GGCTGGCTGG CACTGCCGTT CCTGGGTGCC 
CTGGCGGGAG GCCTGGCCGG CTGGTTGACC AGCCTGGCGC CGGAAACAGC CGGGAGCGGT 
ATCCCCCATG TGGAAGCAGT TTTAATTAAC CTGCGCCGGT TGGTATGGTG GCGGGTCATA 
CCTGTAAAAT TTATAGCCGG GGCCCTGGCC ATCGGGGCCG GGTTATCCCT GGGACCGGAA 
GGCCCGGCGG TCCAGATGGG GGCGGCCGCC GGCAAGGCGG TAAGTGACGG TTTTGGCCGC 
TCGAAAACCG AGGAACTGCA CCTTATCGCC TGTGGTGCCG GGGCCGGCCT GGCAGCGGCC 
TTTAATGCCC CCCTGGCGGG AGTAGTCTTT GTTCTGGAAG AACTAAGACG CAACTTCTCT 
CCCTATGCCC TGGGTGGAGC CCTGGTAGCC TCCGTTGTGG CGGACATGGT ATCCCGGCAT 
ATCCTGGGAC CTTTACCTAC TTTCCGGTTA ATTGAAGCCT GGCCGGTATT ACCATTAACT 
ACCCTGCCGG TATTCCTGGT TTTAGGGGTG CTGGCGGGTA TCCTGGGGGC CGTCTTTAAC 
TGGTCCCTCT TAGCCAGTCT CGAACTGGGG GATAGATTAA ACAGGTTCCC TCGCTGGTTG 
CGGGCCCTGC TGATCCTTTT TCTAGCAGGT ATCCTGGGCT ATTTTTTACC AGAGGTTCTG 
GGGGGCGGGC ACCTGCTGGC GGAAGAAGCC CTGGCCGGAA AGGTCGCCTG GACCCTCATC 
CCCCTTCTCT TTGTGGTCAA GTTTCTCTTG ACTATGATTA GTAACAGCGC CGGCGTTCCT 
GGGGGCATCT TTTTGCCCCT GCTGGTACTG GGGGCTCTAT TGGGTTCCCT CGTGGGACAG 
GTAAGCGGGT TGCTAATCCC CGCCTTTCAA GGCATGGTCC CGGCTTTTGC CATGATCGGT 
ATGGCTGCCT ATTTTGTCGC CATTCTGCGC TTACCCCTCA CTGGGGTAGT TTTAATAATC 
GAGATGACTG GCAGCTACCG GCATATAGTG TTGCTCCTCT TTACCTGTAT GATTGCTTAC 
CTGGTGGTAG AGACCCTGGG GAGCAGACCA GCCTATGAAA TGCTGTTGGA GCGTGACCTG 
GCCAGGGCCA GGGTAGAGGC TGAACCATCT CCGGTTGGCA AGATGTTAAT GCTGGACTTT 
GCCGTTGAGG CTGGCTCTGA TGCCTGCGGT CGCCTGGTAA GGGACCTGGA ACTGCCTCCG 
GATTGCCTGC TGGTTACTAT CCGCCGCAAG GGCAGGGAAA TAATTCCGCG TGGTAATACC 
AGCATTCAGG AAGGAGATCA CCTGGCGGTG ATTACCCCTG AAGAACGGGC GGCAGAAATC 
TGCCATGAAT TATCAGGGGT AACCCGTTGT AAGTTCCAGC AGAAATTGCA ACGATTCTGA

Protein sequence

MARVETVLQE HSVPEGILLR RYSYLLRFLC TGALAGAGAG LVGAAFRLAL TEGDLWRNSL 
LTWAKGIPLW GWLALPFLGA LAGGLAGWLT SLAPETAGSG IPHVEAVLIN LRRLVWWRVI 
PVKFIAGALA IGAGLSLGPE GPAVQMGAAA GKAVSDGFGR SKTEELHLIA CGAGAGLAAA 
FNAPLAGVVF VLEELRRNFS PYALGGALVA SVVADMVSRH ILGPLPTFRL IEAWPVLPLT 
TLPVFLVLGV LAGILGAVFN WSLLASLELG DRLNRFPRWL RALLILFLAG ILGYFLPEVL 
GGGHLLAEEA LAGKVAWTLI PLLFVVKFLL TMISNSAGVP GGIFLPLLVL GALLGSLVGQ 
VSGLLIPAFQ GMVPAFAMIG MAAYFVAILR LPLTGVVLII EMTGSYRHIV LLLFTCMIAY 
LVVETLGSRP AYEMLLERDL ARARVEAEPS PVGKMLMLDF AVEAGSDACG RLVRDLELPP 
DCLLVTIRRK GREIIPRGNT SIQEGDHLAV ITPEERAAEI CHELSGVTRC KFQQKLQRF