Gene Arth_3206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3206
Symbol
ID	4444196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3612878
End bp	3614323
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	58%
IMG OID	639691030
Product	undecaprenyl-phosphate galactose phosphotransferase
Protein accession	YP_832682
Protein GI	116671749
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAGAGA CGCACGCGCA TGACGCTTGG CGGCGCAGGT ACTCTCGGCG GTTGAAACTT 
GTTGATGCTT TTGTAATCGT TTGGGCAGTA GCTGGGGCGT TCGCGGTCCG TTTCGGTTTA 
TCTGAGGTCC CTAACGGCAA TGATCGCGAC ATCGATTACG CGGTGCTGTC GGGGGCACTC 
ATTGTCGCTT GGTGGTTCAT GCTTGAGTTC TGGGGCTCCC GCGATTCTCG GGTATTAGGC 
TCCGGTTCCG AAGAATACAA AAGAGTCCTA GCCAGTTCAG CTTGGCTGTT TGGGTTTGTA 
GCCGTGGTGT CATACGCCCT AAGAATCGAT ACGGCGCGAG GATTTGTGGG TCTGGCCTTT 
CCAGCCGGGG CGCTTGGCCT GCTAGCAGCG CGGTGGCTGG TCCGCCAGCA CCTGAGCCTC 
GAACGCAAGC ACGGCAAGAG TAACTCCCGT GTGCTGATTA TTGGGGGACC GCACTCGGCT 
TCGCACTTAG TGCGTTCCCT AAGCAGTGCA CCAGCTGCAG GATATATGCC TGTTGCGGCA 
CACTTGCCAG GAGCGACAGG AACAGCAGGG CTTTCCGGGC TCACAGTGCC CGTGACGGGT 
TTAGACGCCG ACTTTGACAG TATTCTTGGC GTGATATTGG CCACGAACGT TGATGCCGTT 
GCCATCTCGG CTGGCGTCAA CATGCATCCG CAAGATCTTC GAAGGCTAGG GTGGGAACTA 
GCCGCGCGAG ACATCGGCAT GATCTTGGCG CCTGCCCTGA CCGACATTGC TGGACCTCGT 
ATCCATACCC AGCCTGTCGC AGGTTTACCT CTGATCCATG TGTCCACGCC TAAGCTCACA 
GGCGGGAAGA AAGTGGCCAA GCGGGCGTTC GATATAGTAG TTGCGGGTCT GCTGGTTGCC 
TGCCTCGCTC CGCTGTTTCT CGTGTTGGCT GTACTCGTCC GCTTTACGGA TCCTGGCCCT 
GTGTTCTATC GCCAAGAACG AATTGGTCTC CGCGGCACGA CTTTCCACAT GCTGAAGTTC 
CGGTCTATGA AAGTGGACGC TGACGCCCAG TTGGGCGAGT TACTAGCAGC ACAAGGCTCC 
GCTGATACAC CTCTTTTCAA GGTTGAAAAT GACCCGAGGA TCACACCCCT GGGACGGGTC 
TTGCGAAAGT ACTCTCTGGA TGAACTGCCC CAGCTACTCA ATGTGCTGGG CGGCAGCATG 
AGCCTTGTCG GCCCGAGGCC GCAGCGCGAA GGCGAAGTTG CCCTCTATGA CGACGCGGCC 
CATCGGCGGC TCTACGTTAG TCCTGGCATG AGCGGCCTTT GGCAGGTCAG TGGGCGCTCC 
AATCTTAGCT GGGAGGAGAG CATCCGGCTC GACCTCTACT ATGTGGAAAA CTGGTCGCTC 
ATGGGTGACG TAGTCATTCT CTTCAAGACT TTCAAAGCCG TATTTGCAAG CACGGGCGCG 
GTTTGA

Protein sequence

MEETHAHDAW RRRYSRRLKL VDAFVIVWAV AGAFAVRFGL SEVPNGNDRD IDYAVLSGAL 
IVAWWFMLEF WGSRDSRVLG SGSEEYKRVL ASSAWLFGFV AVVSYALRID TARGFVGLAF 
PAGALGLLAA RWLVRQHLSL ERKHGKSNSR VLIIGGPHSA SHLVRSLSSA PAAGYMPVAA 
HLPGATGTAG LSGLTVPVTG LDADFDSILG VILATNVDAV AISAGVNMHP QDLRRLGWEL 
AARDIGMILA PALTDIAGPR IHTQPVAGLP LIHVSTPKLT GGKKVAKRAF DIVVAGLLVA 
CLAPLFLVLA VLVRFTDPGP VFYRQERIGL RGTTFHMLKF RSMKVDADAQ LGELLAAQGS 
ADTPLFKVEN DPRITPLGRV LRKYSLDELP QLLNVLGGSM SLVGPRPQRE GEVALYDDAA 
HRRLYVSPGM SGLWQVSGRS NLSWEESIRL DLYYVENWSL MGDVVILFKT FKAVFASTGA 
V