Gene Arth_3658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3658
Symbol
ID	4443659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4110102
End bp	4111151
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	639691482
Product	glycosyl transferase family protein
Protein accession	YP_833133
Protein GI	116672200
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTACAG TTATTATCCC TGCGCATAAT GAAGCTGCAG GTATTTCTGA CACGCTCGAA 
TCCCTCAAAT CCCAGACTCA GCCGCCGGAC AGGGTGGTGG TGGTTGCCGA CAAATGCACC 
GATGCCACCG GGGAAATCGC ACTGGCGCTC GGCGCAGAGG TCATCCGCAC GGTGGGAAAC 
ACAGATAAAA AAGCCGGCGC CTTGAATTTT GCGCTGGAGG GCCTACTGCC GGGCGCGAAT 
CCGGAAGACA TGATCCTCGT CCAGGACGCG GATTCGCAGT TGAGCCATGA CTTCATCGAG 
CGGGCAACCG CTCACCTGCG TGCCGACAGG CGGCTTGGCG CCGTGGGCGG CGTCTTCCGC 
GGCGCCGACG GCGGCGGATT CGTGGGTCAC CTTCAGCGTA ATGAGTACGC ACGCTACGCC 
CGGGACGTGA AGCGGCTTCA CGGCAAGTGC CTTGTGGTGA CCGGAACGGC CGCGCTCTTC 
CGCGTCCGGA CCTTGGAGGA TGTCATCGAA GCCCGGCTTG ACGGCACGCT GCCGCCGGGT 
AACTGCAGGG GAGGCGTTTA CGACACCTCC GTCCTGACCG AGGACAACGA GTTGTCCTTC 
GCGCTGCTGA CCCTCAACTA CCGCATCAAA TCGCCGGCCG ACTGCACGCT CGTCACCGAA 
ATCATGCCGA CCTGGCGTGA GCTCTGGGCA CAGCGGCTGA GATGGAAGCG CGGAGCCGTG 
GAGAACTGTG TCCAGTACGG CTGGACCAGG GTGACCCGGC CGTACTGGGG GAGGCAGGCG 
CTCTCCGTGA CAGGCATTGT GGTGTCGTTG GCCTACTTCG GAACGGTGGC TTTTGCACTG 
GGCACGGGAG AAGGGCTGCA CATTCAGCCC TTCTGGATGG CCGTGACCGG TGTCTTCGTG 
ATCGAACGGG TAGTGACTGT GCGGCTGCGT GGCTGGAAGT ACATGCTCGC CGCCGCAACG 
ATGTACGAAC TTCTGATCGA CCTGTTCCTT CAGGTAGTCC ACGCGAAGGC TTACGTGGAT 
GTAGCACTCA ACAAAAAGAA AGCTTGGTAA

Protein sequence

MITVIIPAHN EAAGISDTLE SLKSQTQPPD RVVVVADKCT DATGEIALAL GAEVIRTVGN 
TDKKAGALNF ALEGLLPGAN PEDMILVQDA DSQLSHDFIE RATAHLRADR RLGAVGGVFR 
GADGGGFVGH LQRNEYARYA RDVKRLHGKC LVVTGTAALF RVRTLEDVIE ARLDGTLPPG 
NCRGGVYDTS VLTEDNELSF ALLTLNYRIK SPADCTLVTE IMPTWRELWA QRLRWKRGAV 
ENCVQYGWTR VTRPYWGRQA LSVTGIVVSL AYFGTVAFAL GTGEGLHIQP FWMAVTGVFV 
IERVVTVRLR GWKYMLAAAT MYELLIDLFL QVVHAKAYVD VALNKKKAW