Gene Moth_1232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1232
Symbol
ID	3833173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1271178
End bp	1272503
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	53%
IMG OID	637829167
Product	xanthine/uracil/vitamin C permease
Protein accession	YP_430089
Protein GI	83590080
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.444446
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGAC AACAAGAAGG GGCGGGCTTC CTGGAAAAGA CCTTTAAGTT GAGGGCCAAC 
GGTACTGACG CCCGAACCGA AGTGCTGGCC GGCGTTACAA CCTTTATGAC CATGGCCTAC 
ATTATCTTTG TAAATCCGAC GATTCTCAGT AGCACCGGCA TGGATTTCGG CGCGGTAATG 
GTGGCTACCA TCCTTTCAGC GGCCATAGCC ACCCTGATCA TGAGTTTTAG CGCCAATTAC 
CCTATTGCCA TTGCGCCCGG TATGGGTCTC AACGCCTTTT TTGCCTTTAC TATTGTAAAG 
CAAATGCATT ACCCCTGGGA AGTAGCCCTG GCAGCAGTAT TTATGAGCGG CGTTATCTTT 
ATCATCTTGA CCCTTACTAA AGCCCGGGAG GCTATTGTTA ACTCCATCCC CCTGTCCCTC 
AAGCTGGCGA TCAGTGCCGG TATCGGCCTT TTTATCGCCC TGATCGGCCT GCAAAATGCC 
GGCCTGGTAG TGCCCAATCC CGATACCCTG GTTCAACTGG GCGACTTGAG TAAGCCTCCC 
GTCCTGCTGG CGGCCATGGG CCTGGTAATT ACGGCCCTCC TGGTGGCCCT CCGGGTCCGG 
GGGGCACTGC TCCTGAGTAT CATTATCATC ACTATAATCG GCATCCCCAT GGGAGTTACC 
AAAATCGACA GTTTCAAGCT CCTGAGCCTG CCGCCCAGCC TGGCTCCTAC ATTCGGGGCC 
TTTACCAGGG GCCTGCCGGG CCTATGGGCC ACCGGTCTCA TTCCCATAAT TTTTACCTTT 
ACCTTTGTCG ACCTCTTCGA TACCATCGGT ACCTTGATCG GCGTCAGTAG TAAAGCTAAC 
TTACTGGATG AAAACGGCAA CCTGCCCAGG GCCGGCAAAG CCCTGATCTC CGACGCTGTA 
GGTACCACCC TGGGTGCCAT CCTGGGAACC AGTACCCTGA CAGCCTATAT CGAGAGTGCT 
GCCGGCGTAG CCGAAGGTGG GCGTACAGGA TTGACCAGTC TGGTAGTTGC TATTTTATTC 
CTGGCTTGTT TGTTTATCTC GCCCCTGGTG GGCATCGTAC CGGCGGTAGC TACCGCGCCC 
ATCCTGATCA TCGTCGGTAT TTTTATGATG GAACCGATCA TGAAAATCGA TTTTAGCAAT 
TTCCTGGAAG CAGCCCCGGC CTTTTTAACC ATTGCTATGA TGCCCTTTAC CTATAATATT 
GCCGAGGGTA TCGTGTGGGG CGTCCTGGCC TACGTCTTCC TGCACCTGGT TACCGGCAAT 
ACGAAAAAGA TCAGCATTAC CATGTGGATT CTGGCGGTTC TCTTTATCAT TCGTTTCTTT 
GCTTAG

Protein sequence

MSGQQEGAGF LEKTFKLRAN GTDARTEVLA GVTTFMTMAY IIFVNPTILS STGMDFGAVM 
VATILSAAIA TLIMSFSANY PIAIAPGMGL NAFFAFTIVK QMHYPWEVAL AAVFMSGVIF 
IILTLTKARE AIVNSIPLSL KLAISAGIGL FIALIGLQNA GLVVPNPDTL VQLGDLSKPP 
VLLAAMGLVI TALLVALRVR GALLLSIIII TIIGIPMGVT KIDSFKLLSL PPSLAPTFGA 
FTRGLPGLWA TGLIPIIFTF TFVDLFDTIG TLIGVSSKAN LLDENGNLPR AGKALISDAV 
GTTLGAILGT STLTAYIESA AGVAEGGRTG LTSLVVAILF LACLFISPLV GIVPAVATAP 
ILIIVGIFMM EPIMKIDFSN FLEAAPAFLT IAMMPFTYNI AEGIVWGVLA YVFLHLVTGN 
TKKISITMWI LAVLFIIRFF A