Gene Arth_4122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4122
Symbol
ID	4447642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4638558
End bp	4639739
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	67%
IMG OID	639691953
Product	glycosyl transferase, group 1
Protein accession	YP_833597
Protein GI	116672664
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCAAA CCGGCAGTCT CGACTGCAAG CCAGGGCAAC AGGTTTTCGT GTATGTCCCC 
GGGAGCCGCT GGGAGAACGT TCAGGGAACC GACCACCGGC TGGCGGCAGC TCTGGCGAGC 
CAGGTAGCGG TGCTGTGGGT CGATCCGCCG CTCCCGGTTC ACCTGGCGTT CCGGCATGGG 
ATAAACGCAC TGCGCGTCCG CAACGAACTG AGCAACGTCG CACCCGGCAT CACCCGCTTG 
CGTTCACTTT CCATCCCCGG CTTCACCCGC GCGGTCCTTG CCACTGTTGC CAAGGGCGTA 
TTGGGGCATG CCATCAGGTC CGCTCTCCGG ACCATGAAGG CTACCCCCGT CGCCGTGATG 
GTCTCATCGC CCACCTCCGG TTTCCCCACC CGGCTGGCGG GCCGGAAGAT CCTTTTTGTC 
ACCGATGACT GGGTGGCCGG AGCGCCATTG ATGGGCCTGT CCGGTCCGTT GGTGCGCCGT 
ACGCTGCGCC GGAACCTCCG CGAGGCGAAC ATCGCCGCGG CCGTGTCCCC GCATCTGGCC 
GAAAACCTGG AGGCGAGCTT CCCTGACCGC CCGGCCTCCG TCGTCGTCCT GCCTAACGGC 
TGTGATCCCG GGAAGGACGC CCCGCTTCGC GTCGAACGCT CCGACAACGC CGCCCTCGTG 
GGCCAGCTGA ACGAAAGGCT GGATATGGAT CTGTTGGAGG CGGTCACGGA TGCGGGGGTC 
CCGTTGCTGG TCATCGGTCC CCGGACCGAA CGCGACCCGG AGACCGGCCG GCGCCTCGAC 
CTCTTCCTGG CTTCCGAGAA CGTCACCTGG CTCGGTGAGC TTCCGACCAC GGAACTGGGG 
CAGCACCTGG CGGCAGCGGG CGTGGGCCTG ACTCCGTACG CCGACACCCC CTTCAACCGG 
GCGAGCTTCC CCCTAAAGAC TTTGGAGTAC CTTGCCGCCG GCGTACCGGT TGTCGCCACC 
GACCTGCCGG CCGTCCGGTG GTTGAACACG GAACTGGTGA CCGTCGGCAG CGGCCGTGAC 
GAGTTCGCAA AGCGCGTTCA GCAGGCACTG GCCGGCCCGC ACGATCCCCT GGCGGAGGAA 
CAGCGCCGTC ACTTTGCGGC ACTCCACACC TGGGAGGCAA GGGCCAACCA GCTCCTTGAC 
ATGGTGGGCC CGCATGGCCA GGCAGGAGGC ATGGCCGCGT AG

Protein sequence

MLQTGSLDCK PGQQVFVYVP GSRWENVQGT DHRLAAALAS QVAVLWVDPP LPVHLAFRHG 
INALRVRNEL SNVAPGITRL RSLSIPGFTR AVLATVAKGV LGHAIRSALR TMKATPVAVM 
VSSPTSGFPT RLAGRKILFV TDDWVAGAPL MGLSGPLVRR TLRRNLREAN IAAAVSPHLA 
ENLEASFPDR PASVVVLPNG CDPGKDAPLR VERSDNAALV GQLNERLDMD LLEAVTDAGV 
PLLVIGPRTE RDPETGRRLD LFLASENVTW LGELPTTELG QHLAAAGVGL TPYADTPFNR 
ASFPLKTLEY LAAGVPVVAT DLPAVRWLNT ELVTVGSGRD EFAKRVQQAL AGPHDPLAEE 
QRRHFAALHT WEARANQLLD MVGPHGQAGG MAA