Gene Arth_3211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3211
Symbol
ID	4444201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3619123
End bp	3620094
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	62%
IMG OID	639691035
Product	UDP-glucose pyrophosphorylase
Protein accession	YP_832687
Protein GI	116671754
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.464773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAGGC CTCCCCATGA GCCGCGTAAT CTTGGCCGTG AATTGCCAGT TTCCTCAAAC 
GATTTGTATG GTTCAGCTAT GACTTTGGGG AAATCAGTAA GAAAAGCCGT CATTCCTGCT 
GCCGGTTTGG GAACTCGCTT CCTGCCCGCC ACCAAGGCGA TGCCGAAGGA AATGTTGCCG 
GTTGTTGACC AGCCCGCAAT CCAGTACGTG GTGGAGGAAG CCGTCAAGGC AGGGCTGACG 
GACCTCCTGA TGATCACCGG ACGCCAGAAG CGGGCCCTGG AGGACCACTT TGACCGGGCA 
CCTGCCCTGG AGCGGACCTT GGAGCTTAAG GGCGACCTGG ACCGGCTGGA GGCTGTCCAG 
CACGCCTCCA GCCTCGCTCC GCTGCACTAC CTGCGCCAGG GAGATCCCAA GGGTCTGGGC 
CACGCGGTGC TGTGCGCGCG CCAGCACGTG GGGGACGAGC CGTTCGCCGT CCTGCTTGGT 
GACGACCTCA TCGACGAACG GGATGAGCTG CTGAGCACCA TGATCGACGT GCAGGCCAAG 
ACCGGAGGCT CCGTCATCGC ACTGATCGAA GTGGACCCGT CCCAGATCAG CGCCTACGGC 
TGCGCGGACA TCACGCCCGT GGACGGCGAG AACTATTTTC AGGTGAACCG CCTGGTGGAA 
AAGCCCTCTG TAGACGAAGC CCCCTCCAAC CTGGCAGTCA TCGGCCGTTA CGTGCTGCAC 
CCGGCCGTGT TTGATGTGCT GGAAGAAACC GAGCCGGGCC GCGGCGGTGA GATCCAGCTG 
ACGGACGCCC TGCAGACCCT GGCAACGTCT GACGGCGAAG GCGGGGGCGT TTATGGCGTG 
GTGTTCCGCG GGCGCCGCTA CGACACCGGA GACAAGCTCA GCTACATCAA GGCGGTTATT 
TCCATCGCCT CGGAGCGCGT CGACTTCGGC GAGGACCTCA AGGCCTGGAT GAAGGAATTC 
GTGAACGACT AA

Protein sequence

MGRPPHEPRN LGRELPVSSN DLYGSAMTLG KSVRKAVIPA AGLGTRFLPA TKAMPKEMLP 
VVDQPAIQYV VEEAVKAGLT DLLMITGRQK RALEDHFDRA PALERTLELK GDLDRLEAVQ 
HASSLAPLHY LRQGDPKGLG HAVLCARQHV GDEPFAVLLG DDLIDERDEL LSTMIDVQAK 
TGGSVIALIE VDPSQISAYG CADITPVDGE NYFQVNRLVE KPSVDEAPSN LAVIGRYVLH 
PAVFDVLEET EPGRGGEIQL TDALQTLATS DGEGGGVYGV VFRGRRYDTG DKLSYIKAVI 
SIASERVDFG EDLKAWMKEF VND