Gene Moth_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1119
Symbol
ID	3833251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1147120
End bp	1148415
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	58%
IMG OID	637829047
Product	aluminium resistance
Protein accession	YP_429976
Protein GI	83589967
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4100] Cystathionine beta-lyase family protein involved in aluminum resistance
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.165119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGTACC TGGATAGCAT TAGCAAGCTT TTTCCTGTTG ATTCCTGGTT GGTAGAAAGG 
CTCCGGCAGG CGGAACATGC CAGCCGGGAA GCCCTAACCG CAGTTGAGGA GGTTTGTGCC 
TTTAACCACC TGAAGGTTCT TCGGGCCTTT CAGGATGCGG GGGTAACCGA ATTTCATTTT 
CAGGATTCTA CTGGTTATGG TTACAGCGAT CTGGGTCGGG ACGTTCTGGA ACGGATTTAT 
GCCAGGATTT TTGGGGGCGC AGCCGGCCTG GTACGGTCCC AAATTGTTTC CGGTACCCAT 
GCCCTTACCC TGACCCTCAG GGCTATTCTA CGCCCCGGGG ATACCCTGCT GGCAGCCTGC 
GGCCGGCCCT ATGATACCCT GGCGACAGTT ATCGGCCTGG GTCCCCGGGT GCCAGGTACC 
CTCAGGGAGT GGGGGATAGA ATACCGGGAA GTGAAACTCG ACCCTGCCGG GCGTCCCGAT 
CTGGCGGGAC TGGGGGCAGC GGTAGCCGAG ATAAAACCGC GCCTGTGCCT GATCCAGCGT 
TCCCGTGGTT ATGCCCTGCG GCCTGCCCTG GGGGTAGACG AACTGGCGCG AATAATTGGT 
GCCGTCAAAG CAGCCAGCAG GGAAACCATC TGCCTGGTAG ACAACTGTTA CGGCGAATTG 
GTCGAGGAAA GGGAACCAGG CGAGGTAGGG GCTGATCTGG TGGTTGGTTC TTTAATTAAA 
AATCCTGGTG GTGGGCTGGC ACCGGGTGGA GGTTATATAG TTGGCCGGGA GGAGCTGGTA 
GAAGAAGTAG CTGCTGCCCT CACTGCCCCG GGCCTGGGGA GTGAGCTGGG AGCCTTTGAA 
AATAAGCGCC TTTATTACCA GGGGCTCTAC CTGGCACCTA TAGTGGTAAG GGAGGCCCTG 
CGGGGGGCGA TTGTCGCCGC CTCCTTTTTC CGGGATTTAG GGTTTAAGGT AGATCCCCTG 
CCGGATGCCC CCCGGCGGGA TATTGTCCAG TGCCTTATCA TGGGGAAAGA GGAAGTATTG 
CTGGCTTTCT GCCAGGGGCT CCAGAAGGGG TGCCCGGTAG AAGCCACGAC CCGGCCAGAA 
CCGGCTAACC TGCCCGGTTA TGCCGACCCT GTGATCATGG CCGGGGGAAC CTTCATCCAG 
GGTTCTTCCA TCGAACTCAG CGCCGACGGC CCCTTACGCC CGCCTTATGC AGTATTTTTA 
CAGGGGGGGC TCTCCTACCC TTATACCAGG GTGGCCCTCC TTATGGCAGC CCAGGAGATG 
GTAAACAGGG GGTTAATTCA AGAGAAATGG CGGTAG

Protein sequence

MAYLDSISKL FPVDSWLVER LRQAEHASRE ALTAVEEVCA FNHLKVLRAF QDAGVTEFHF 
QDSTGYGYSD LGRDVLERIY ARIFGGAAGL VRSQIVSGTH ALTLTLRAIL RPGDTLLAAC 
GRPYDTLATV IGLGPRVPGT LREWGIEYRE VKLDPAGRPD LAGLGAAVAE IKPRLCLIQR 
SRGYALRPAL GVDELARIIG AVKAASRETI CLVDNCYGEL VEEREPGEVG ADLVVGSLIK 
NPGGGLAPGG GYIVGREELV EEVAAALTAP GLGSELGAFE NKRLYYQGLY LAPIVVREAL 
RGAIVAASFF RDLGFKVDPL PDAPRRDIVQ CLIMGKEEVL LAFCQGLQKG CPVEATTRPE 
PANLPGYADP VIMAGGTFIQ GSSIELSADG PLRPPYAVFL QGGLSYPYTR VALLMAAQEM 
VNRGLIQEKW R