Gene Acel_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1939
Symbol
ID	4486358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	2196923
End bp	2198413
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	65%
IMG OID	639730730
Product	undecaprenyl-phosphate galactose phosphotransferase
Protein accession	YP_873697
Protein GI	117929146
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGTTC TTGATGAGGT CTCGACGCTT CCGCGTCGGA CCGATCGGGT GTTGCGTACA 
ACGCGGAGCC GGCGTGCCGT CCGGGACCGG CTCAGCTTCC TGCGTCGCTA TGGCCGGGTG 
CTTGCCGTAG CGGAAGGGGT CATCGCGGCT CTTGCGGTTC TCGTGTATTC ATCCGGGTAC 
GCCGGCCGGG TCGATCGAGC AGCCTGGCTC CAGGTCGTCG CGCTTGGCTT GGGCTGGCCG 
GCGACCTTGG CGTTGCTGCG CGCGTACGAA CCCCGCTTTC TCGGGCTGGG GTCTGAGGAG 
TATCGCCGCG TCGTGCATGC GGGACTCGGC CTCACCGCGT GCATTGCGAC CGCCGGGTAT 
GCGACGTCCT CGCTCGGCGG CCGCGGCGTC GCTCTCTTTG CCGTGCCCGG CGCGATGACC 
GCGACCCTCG TGACGCGTTA CGGTGCGCGA AAGTGGCTGC ATTTCCAGCG ACGGCAAGGC 
CGCCACCTGC AACGGGTGCT GATTGTCGGA CACGATGCGA CTGCGGCTGA GCTTGCGGAG 
GCGATGCGGC GGGAAGCGTA CGCGGGTCTC TTCGTCGTCG GTGCCTGCGT TCCCGGTGGG 
AAGGCCGGTT CGCACCATCG GCTGGACGCC GCCGGTGTAC CGGTCATCGA CGATCTGGAG 
TCGGTGACGC GGGCGGTCGT CGCGGTAGAC GCCGCGGCCG TCGCCGTCCT GCCGTGCCCG 
GAATTGTGCG GACCCAAGCT CCGAAAACTC GGATGGGATC TCGAAGCGGC AGGAGTCGAT 
CTCATCGTCG CTCCCACCAT CGTGGATGTC ACGGGTCCAC GCATTCACAT CCGGCCGCTC 
GCGGGCTTGC CGCTCCTGCA CGTGGAAGCC CCCGAATTTC ACGGATTCCG CCGTGTCTTG 
AAAGAAGCGT TCGACCGGTT CGCGGCGGCG ATCGCCCTTA TCGTTCTCAG CCCGCTTCTC 
CTCGCCGTCG CGATTGCGGT GGTTGCAACG AGCGACGGCG GTGCATTCTT CTGCCAGCAG 
CGGGTCGGCA AGGGCGGCAA GTCTTTCCGG ATGTACAAAT TCCGGTCCAT GTACGCCGAC 
GCTGAGCACC GGCTCACCGA GTTGCTGGAC AAGAACAAGC ATGGTGCTAC TGGTGTGCTG 
TTCAAACTCG TCGACGATCC GCGGGTGACG CCGGTCGGCC GATTCCTCCG GCGGTATTCC 
CTCGATGAAT TGCCGCAATT GGTCAACGTT CTTCTCGGTC ATATGTCGCT CGTCGGTCCT 
CGGCCGCCGT TGGCCCGCGA AGTCGCCATG TATGGGCCGG AAGCGAAACG CCGCCTCCTC 
GTCAAGCCGG GCCTCACCGG GCTCTGGCAA ATCAGCGGCC GGTCTGACCT CGATTGGCAG 
ACCTCCGTGC GGCTTGACCT CTGGTACGTC GAGAACTGGT CCTTCTGGTT GGATCTCATG 
ATTTTGTGGA AGACCGCCTT TGCTGTCGTC CGTGGGTCCG GTGCGTATTG A

Protein sequence

MVVLDEVSTL PRRTDRVLRT TRSRRAVRDR LSFLRRYGRV LAVAEGVIAA LAVLVYSSGY 
AGRVDRAAWL QVVALGLGWP ATLALLRAYE PRFLGLGSEE YRRVVHAGLG LTACIATAGY 
ATSSLGGRGV ALFAVPGAMT ATLVTRYGAR KWLHFQRRQG RHLQRVLIVG HDATAAELAE 
AMRREAYAGL FVVGACVPGG KAGSHHRLDA AGVPVIDDLE SVTRAVVAVD AAAVAVLPCP 
ELCGPKLRKL GWDLEAAGVD LIVAPTIVDV TGPRIHIRPL AGLPLLHVEA PEFHGFRRVL 
KEAFDRFAAA IALIVLSPLL LAVAIAVVAT SDGGAFFCQQ RVGKGGKSFR MYKFRSMYAD 
AEHRLTELLD KNKHGATGVL FKLVDDPRVT PVGRFLRRYS LDELPQLVNV LLGHMSLVGP 
RPPLAREVAM YGPEAKRRLL VKPGLTGLWQ ISGRSDLDWQ TSVRLDLWYV ENWSFWLDLM 
ILWKTAFAVV RGSGAY