Gene Moth_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2065
Symbol
ID	3831096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2157647
End bp	2158873
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID	637829993
Product	Sodium/hydrogen exchanger
Protein accession	YP_430903
Protein GI	83590894
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0475] Kef-type K+ transport systems, membrane components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0630296
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAAC AGGTGCTCCT TGAAATCGGG CTAGCATTAG CTATCGTAGC TTTTGCCGGG 
ATCCTTGCCG CCAGGTTCCG CGTTTCTATT GTACCGCTCT TGATCCTTGC CGGTATGGTT 
GTCGGCCCTC ATGCGCCGGT AATTGGTATC CTGGATTTTC GCTTTATTAA AAGCGCGCCT 
TTAATAGATT TTATGGGGCG GGTAGGGATA CTCTTTCTCC TTTTCAGCCT CGGCCTGGAG 
TTTTCCGTCG GGAGATTATT AAAGGCAGGC CGTTCTATAC TGGTGGGCGG GTCCATCTAT 
ATGGCCATAA ATTTTACCCT GGGCATGGTT CTACCTATAA TTTGGGGTTG GCCGTTGCGG 
GAAACCCTGG TGGTAGCCGG GCTTATTTCT ATTTCCTCAA GCGCCATTGT TGCCAAGGTT 
CTGGTTGACC TAAAGCGAAC GGCACGGCCG GAAACCGAGA TGATCCTGGG GCTTATGTTA 
TTCCAGGACG TATTCGTAGC AGTGTATCTA TCCATCATTT CCGGTCTGGT CCTTACAGGT 
TCGGCCTCAC CGGCGAGCGT GTTGAAATCT ACCTCCCTTG CCCTGGGATT TATGCTGGGC 
TTAATTCTCG CCGGCCGCAA ACTGGCACCG TTAATTAACA GGCTGCTTAA CGTTCCTTCC 
GATGAAGTTT TTATGCTCAT AGTCTTTGCT TTCCTCACCC TGGTAGCCGG TTTTTCAGAG 
ACTATCCATG TGGCGGAAGC TATTGGCGCC TTGCTGGTGG GTTTAATTTT AGCCGAGACA 
GACCATCTCG ACCGCATCGA GCATATTGTC GTGCCGTTCC GTGATTTTTT CGGGGCCCTG 
TTTTTTTTCA GCTTCGGTTT GAGCATCGAC CCTTTAACCT TGGGAGGGGC CGTCGGGCCG 
GTTTTGACTG CCGTAGCGGC AACATTAACA GGCAATTTTC TTGCTGGTAT TCTTGCCGGA 
CGAATGGCCG GTTATTCGTA CCGGGGGTGT ACCAATATCG GGCTTACTAT TACTCCCCGC 
GGAGAATTTT CTATCATCCT CGCCAATCTG GCGAAGACCG GCGGATTACT GCCGGTGCTA 
CAACCCTTCG CAGCCCTGTA TGTGTTGCTT ATGGCTATTC TGGGTCCTTT ACTTACGAAA 
GAATCTAAAT GGATATACAA CCAACTGGCT CACATCTTTG GTTGGCCTGC CTGGAAAGAG 
ATAAATAAAC CCGATAGAAC GATATAA

Protein sequence

MPEQVLLEIG LALAIVAFAG ILAARFRVSI VPLLILAGMV VGPHAPVIGI LDFRFIKSAP 
LIDFMGRVGI LFLLFSLGLE FSVGRLLKAG RSILVGGSIY MAINFTLGMV LPIIWGWPLR 
ETLVVAGLIS ISSSAIVAKV LVDLKRTARP ETEMILGLML FQDVFVAVYL SIISGLVLTG 
SASPASVLKS TSLALGFMLG LILAGRKLAP LINRLLNVPS DEVFMLIVFA FLTLVAGFSE 
TIHVAEAIGA LLVGLILAET DHLDRIEHIV VPFRDFFGAL FFFSFGLSID PLTLGGAVGP 
VLTAVAATLT GNFLAGILAG RMAGYSYRGC TNIGLTITPR GEFSIILANL AKTGGLLPVL 
QPFAALYVLL MAILGPLLTK ESKWIYNQLA HIFGWPAWKE INKPDRTI