Gene Arth_4054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4054
Symbol
ID	4447785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4575990
End bp	4577306
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	67%
IMG OID	639691885
Product	glycosyl transferase, group 1
Protein accession	YP_833529
Protein GI	116672596
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTCC TTGTCTACCC ACACGACCTC GGCATCGGGG GAAGCCAGAT CAACGCCATC 
GAGCTCGCCG GTGCCGTTCA CCGGCTGGGC CACGAGACCA TCGTGTTCGG GCGGCCAGGT 
CCGCTCGTTG AAAAAGTCCG TGAGTTGGGG CTGGAATTCG TGGCTGCCCC GGAGATGGGC 
AGGCGGCCTT CCGTGGCCGT GACCCGGGCA TTGGCCGGGC TTGTTGAGAG CCGGTGTATC 
GACATCCTGC ACGGTTACGA GTGGCCGCCT TCGTTGGAAT GCTATCTGGC GGCACGCAGA 
CTGACCCGGG TGGCTGCGGT TTCCACGGTC ATGTCCATGG CCGTCGCGCC GTTCATCCCC 
AAACATGTTC CGCTGACGGT CGGAACCCAT CAAATCGCGG AAGCCGAAGC CGGCATCGGC 
CGCTCGGCCG TCACCGTGCT GGAGCCCCCC GTCGACGTGG ATGCGAACCG TCCCGGCCTT 
GACCTTGCGC AGGGAGAGCT CCGGAGAAGG TGGGGTATCG CAGACGCCGG GCATGTTGTG 
GCGGTCGTGT CCCGCCTCGC CCGGGAGCTC AAGCTGGAGG GCATCCTCAG CGCCATGGAG 
GCGGTGGCAT CCCTCCCGGC CGGAATGCGG GTTTGCCTGC TCATCGCCGG TGATGGCCCG 
GAGTGTGCGG AAGTTACCGA GAGGGCGGCA CAGATCAATC TCCGCACCGG CCGGCAGACG 
GTTGTCCTGG CCGGTGAACT TGCGGACCCC CGGGCGGCTT ACGATGTGGC CGACGTTTGC 
CTTGGCATGG GCGGATCGGC GCTGCGCGCG CTGGCCTTCG GCAAACCGCT CGTAGTCCAG 
GGTGAAGAAG GTTTCTGGGA GCTCCTGACG CCTTCCTCAC TTGAGACCTT CCTGTGGCAG 
GGATGGTACG GCGTGGGCAG CGGGCAGGCC GGCGGCGCGT CCACCCTCCG CCAGATACTG 
TTTGAGATCC TGCCGGCCGA GGGTCTTCGC GCTGAACTCG GGGACTTCGG CAGGCGCGTT 
GTGGTGCACC GCTATTCGTT AGGACACGCT GCGGAGGCCC AGCTGGCCAC CTACGCGGCC 
GCCCTGGATG CGGTGTCATC CGGCCGACGA GCGACCTTCC GCGAACTCGA GGCTGCCGGC 
CACTTCCTCC GCTACAAAAG CCGCCGGCTG CAGGCGCGCC TGACCGGCCG GGGCTCTGCT 
GACGATTTCA ACGCCAGCCC CGTCGCAGCC GCACAACCGG TGCAGGCATT CTCTGCCGGA 
GTTTCCGGCC CGGTTGCCAG GATGGCCGGC ACCAGTCCTT GGCGGAGCCG GCCATGA

Protein sequence

MRVLVYPHDL GIGGSQINAI ELAGAVHRLG HETIVFGRPG PLVEKVRELG LEFVAAPEMG 
RRPSVAVTRA LAGLVESRCI DILHGYEWPP SLECYLAARR LTRVAAVSTV MSMAVAPFIP 
KHVPLTVGTH QIAEAEAGIG RSAVTVLEPP VDVDANRPGL DLAQGELRRR WGIADAGHVV 
AVVSRLAREL KLEGILSAME AVASLPAGMR VCLLIAGDGP ECAEVTERAA QINLRTGRQT 
VVLAGELADP RAAYDVADVC LGMGGSALRA LAFGKPLVVQ GEEGFWELLT PSSLETFLWQ 
GWYGVGSGQA GGASTLRQIL FEILPAEGLR AELGDFGRRV VVHRYSLGHA AEAQLATYAA 
ALDAVSSGRR ATFRELEAAG HFLRYKSRRL QARLTGRGSA DDFNASPVAA AQPVQAFSAG 
VSGPVARMAG TSPWRSRP