Gene Arth_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1070
Symbol
ID	4446441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1156077
End bp	1157381
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	68%
IMG OID	639688876
Product	glycosyl transferase, group 1
Protein accession	YP_830564
Protein GI	116669631
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTTCAAC GCTGCCCGGC TGTTAACCCA ACCTTCCTTT TCCGGTCATG CCCGCTCCCC 
CTCGGCGCAA CGCGCCGCCC GCACCGTGGA GGGGTGAGGA TCGCAATCGT TGCTGAATCA 
TTCCTGCCAC TGATGAACGG GGTTACGCAC TCCATCCTTC GGGTGCTTGA GCATCTGCAG 
GAGCGGGGCG ATGGCGTCAT GGTGATCGCC CCGTCGACAC AGGACACGGA GGTCCTGGAC 
GTGGTGCACG GCGCGTTCGT GCACCGGCTT CCGTCGGTGC CGCTGGCCGG CTACTCGAAC 
GTGCGGGTGG CGTTGGGCGG TGTGAACCGG GTCAAGAGAA TCCTTGCCGA TTACGCGCCC 
GACGTTGTCC ACCTCGCGTC CCCGTTCGTG CTCGGCTGGC GGGCGGTGCA GGCCGCTCAC 
CAGCTGGGGA TTCCCACAGT GGCCATCTAC CAGACCGAGG TCCCCAGCTA CGCGGCGCGC 
TACGGTGTGC CGTTCATGGA GAACTGGGCC TGGAACCGGG TGGAGAACAT CCACCTGCTG 
GCGTCCCGGA CGCTGGTGCC ATCGACTTTC GCGCTGAACC AGTTGCGCGG CCGCGGAGTT 
CTGCGGGTGG ACATGTGGCG GCGCGGTGTG GATACCGCGC GGTTTGCGCC GGAAAAGCGC 
GACGACGGGT GGCGGGCCTC CGTGGCCCCC GGCGGCGAGC GGATCATCGG CTATGTGGGC 
CGTCTGGCCG TTGAAAAGCA GGTGGAGGAC CTGGCCGTGC TGGCCGATGT GCCGGGCACG 
CGGCTGGTGA TCGTGGGCGA CGGACCGCAG CGCGAGGCGC TGCAGGAAGC CCTGCCGAAC 
GCCGTGTTTG CCGGGTTCCT GGGCGGTGAG CAGCTGGCCA GCGCGGTGGC GTCCTTCGAC 
CTGTTCGTGC ATCCGGGCGA GTTCGAGACC TTCTGCCAGA CCATCCAGGA GGCCATGGCA 
TCGGGCGTGC CGGTGGTGGC CACGGGACGC GGTGGCCCGT TGGACCTGGT GGAAAATTCC 
CGCACTGGCT GGCTGTACAG GCCGGGCGAC CTCGCCGGGA TGCGGGCACA TGTCATGGAC 
CTGATGGGCG ACGACGCCAA GCGCCGCGCG TTCGCTGCGG CAGCGCACGC TTCGGTCCAG 
GGGCGGACAT GGCCGGCGTT GAGCGCGGAG CTGGTGCGCC ATTACCGGGC TGTCATCGCC 
GGTGAACCGG TGGTTGAGCC TGTCGGGCGA ATGCCGGTGG TTGAGCCCGT CCGACGGGTA 
CCGGCGGTTG GGCCTGCCGA AACCAAAAGA GGAGCAACGC TGTGA

Protein sequence

MLQRCPAVNP TFLFRSCPLP LGATRRPHRG GVRIAIVAES FLPLMNGVTH SILRVLEHLQ 
ERGDGVMVIA PSTQDTEVLD VVHGAFVHRL PSVPLAGYSN VRVALGGVNR VKRILADYAP 
DVVHLASPFV LGWRAVQAAH QLGIPTVAIY QTEVPSYAAR YGVPFMENWA WNRVENIHLL 
ASRTLVPSTF ALNQLRGRGV LRVDMWRRGV DTARFAPEKR DDGWRASVAP GGERIIGYVG 
RLAVEKQVED LAVLADVPGT RLVIVGDGPQ REALQEALPN AVFAGFLGGE QLASAVASFD 
LFVHPGEFET FCQTIQEAMA SGVPVVATGR GGPLDLVENS RTGWLYRPGD LAGMRAHVMD 
LMGDDAKRRA FAAAAHASVQ GRTWPALSAE LVRHYRAVIA GEPVVEPVGR MPVVEPVRRV 
PAVGPAETKR GATL