Gene Athe_0938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0938
Symbol
ID	7407839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1039514
End bp	1040503
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	39%
IMG OID	643715307
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_002572816
Protein GI	222528934
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAC TTAGATGGAA TCCTCTTTTA CGTGACTGGG TAATGATTGC ATCGCACAGA 
CAAGAAAGAC CACAAATGCC TAAAGACTGG TGCCCGTTTT GTCCTGGTTC TGGCAAGGTT 
CCAGAAAGTT ATGATGTTTT AGAATATGAT AACGACTTTC CAGCTTTAAT GCAAAATCCA 
CCACAACCAG ATGATGTTGC TACGTCTTTT TATAAGGTTG CACCCGCATA TGGAAAATGT 
GAGGTGATTT TGTACTCTCC AAATCATATC ATAACACTGC CTGAGCTTGA GGTCTCTCAT 
ATAAGAAAGC TTGTGGACTT ATGGGTTGAA AGATTTGAAA CTCTAAGGAA AGATAAAAAC 
ATAAAGTTTA TATTCATCTT TGAAAACAGA GGTGAGGTAG TGGGTGTCAC AATGCCGCAT 
CCACATGGTC AGATATATGG ATATTCATGG ATACCACTAA AAATCTTACG TGAACTTGAA 
AGTGCTAAGA TGCACTATGA AGATCATGGT GAGTGTTTAA TCTGCAGGAT TGACAGAGAA 
GAGATGGAGT TTAAAAAGAG AATAATCATA GAAAACGACC ATTTTGTAAC ATACCTACCT 
TTCTTTACTG AATATCCTTA TGGTGTGTTT ATATCTCCAA AACGACATGT GGGGACGATT 
GCTGACCTTT CAGCAGAAGA AAAAAACAGC TTTGCAAAGA TATTAAAAGA GACAACAGGA 
ACATTGGATA GTCTTTTTGA CTATCAGTTC CCGTACATGA TGTGTATGCA TCAGCTACCT 
GTCAATGTCG ATGAGGACTA TTCAAAATTT TACCATTTTC ATGTAGAATT TTACCCACCT 
ATGCGCTCGA AAGATAAACA AAAGTTTAAT GCGTCGAGTG AAACAGGGGC ATGGGCACCG 
TGTAACACCA CTTCACCTGA GGAAAAGGCA GAAGAGCTGA GACAGGCTTA TAAAAGATTT 
ATGAAAAAGA TGCAAGGAGG AATCAAGTAA

Protein sequence

MAELRWNPLL RDWVMIASHR QERPQMPKDW CPFCPGSGKV PESYDVLEYD NDFPALMQNP 
PQPDDVATSF YKVAPAYGKC EVILYSPNHI ITLPELEVSH IRKLVDLWVE RFETLRKDKN 
IKFIFIFENR GEVVGVTMPH PHGQIYGYSW IPLKILRELE SAKMHYEDHG ECLICRIDRE 
EMEFKKRIII ENDHFVTYLP FFTEYPYGVF ISPKRHVGTI ADLSAEEKNS FAKILKETTG 
TLDSLFDYQF PYMMCMHQLP VNVDEDYSKF YHFHVEFYPP MRSKDKQKFN ASSETGAWAP 
CNTTSPEEKA EELRQAYKRF MKKMQGGIK