Gene Arth_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1239
Symbol
ID	4446268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1362956
End bp	1363939
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	66%
IMG OID	639689047
Product	glycosyl transferase family protein
Protein accession	YP_830733
Protein GI	116669800
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.289253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGACG GCCGCGTAAC GGTGGTGGTC CGGACCAAGA ACCGCCCCGT CCTGCTCCAC 
CGCGCCCTGG AGGACATCCT GGGCCAGTCC TACCAGGACT TCTCCATCGT GGTGGTCAAC 
GACGGCGGGG ATCCGGCTCC GGTCGACGCG CTGGCGGAAG GATACAGCCA CCTCCCGGCG 
GGGAAGCTGA AGGTGCTCCA CCATGCACAG AGCAAAGGCA TGGAAGCAGC CAGCAACGCA 
GGCATTGCCG CCGCAACGTC GGAGTACGTC GCCGTGCATG ACGACGACGA CCGGTGGCAC 
CCGGATTTCC TGCTCAAGAC CGTTGGCTTG CTGGACGGGA AGCCCGCCGC GCACGGAGTT 
GCCGTCAGGA CCAATGTTGT ATACGAGGAA GTCCGCGACG GCGAGATCGT GGAGACGGGC 
TCCTTCGCGT ACTGGCCCGA GCTGCGGGCC ATCACGCTGA CGGACATGCT CCGGATCAAC 
AGGATCGTCC CCATTTCCTT CCTGTACCGC CGCTCCGTGC ACGACCACGT GGGGTTCTAT 
AACGAGGAAC TCGACGTCGT GGGGGACTGG GAGTTCTACC TGCGGTTCCT GCAGGCCTAT 
CCGATGGAAC TGCTCGACGA CGAGCCGCTG GCCTTCTGGT GCCAGCGGCC GGCAGCGAGC 
GGAGACATGG GTAACAGCGT TATCGCCGCG GCCGACGAAC ATGCGAAGTT CGACAGCCTC 
GTGCGGGATG CGTTCCTGCG GCGCGAAGCC GGCAAGACTG GAGTTGGTTA CCTTCTCTAC 
CTGGCCCAGC TGAGCGGGCA ACAGGAGGAA GCCGCTGCAG AGGCCCGGGC GCTGGCCGAC 
CGGGTGGTAT CCACCCTGGA GGACCTCAGC AGGCGCATTT CGGTCCTGGA GGAGACAGTG 
GTCCGGCGGA CCAGCGTCTT CGAGTTCGTC GGCCGCCCGG CCCGCGTTGC AGCGCGGCTC 
TGGAAATCCC GCCGGAGGGA TTAA

Protein sequence

MADGRVTVVV RTKNRPVLLH RALEDILGQS YQDFSIVVVN DGGDPAPVDA LAEGYSHLPA 
GKLKVLHHAQ SKGMEAASNA GIAAATSEYV AVHDDDDRWH PDFLLKTVGL LDGKPAAHGV 
AVRTNVVYEE VRDGEIVETG SFAYWPELRA ITLTDMLRIN RIVPISFLYR RSVHDHVGFY 
NEELDVVGDW EFYLRFLQAY PMELLDDEPL AFWCQRPAAS GDMGNSVIAA ADEHAKFDSL 
VRDAFLRREA GKTGVGYLLY LAQLSGQQEE AAAEARALAD RVVSTLEDLS RRISVLEETV 
VRRTSVFEFV GRPARVAARL WKSRRRD