Gene Arth_3204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3204
Symbol
ID	4444194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3610047
End bp	3611273
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	51%
IMG OID	639691028
Product	glycosyl transferase, group 1
Protein accession	YP_832680
Protein GI	116671747
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGTCG AAAGTTTGAA TCTGATTGAA AATCGAACTC GGTACTCTAA ACGTACTGAT 
CAAACGGGAG GACCTGGAAC CAGCATGAAG TTTGTCATCG CATCCCACAG TGAGAGGCTC 
GCCGGTGCCG AACGTTCTCT TTTCGCCATT GTAGCCGCAG CCCTTGAGGC TGGACACGAG 
GTCGTCGTCA CTGTCCCACA GCAGGGTGCT CTGCAATCAA AAATAAATGT GACGTTTCCC 
GACGTGCAGG TCATCGAAAT TCCGACGCAC TCTTGGATGC ACGGTTCAAG ATTCACTTTC 
AAGTCGGTTC CGAGGACTTT GACTTCGATA TTGGAGTCAA TCGTTCACGC CAGGCTTTAT 
CGTCAAATAT CGCCTGATTT TATCGTCATC AACTCATCCG TTATCCCAGC GCCAATGATA 
GCTGCTGCGC TTTGTCGAAT ACCGTCGATA GTAATGGTTA GAGAATCTAT CAGGACAAAT 
ACTCAACTAT TTTCTATAGT ACCCAAGAGC ATTTTAATAC GATTGATTGA AGGAATGTCT 
ACCTTCCGCT TTGCGGTTTC ACATTACGTT GCGGACCAGT TGAATCAACC GTGCACGGTT 
GATTTCCCAG ATGTTAGGCG CGACTTGGGC ATAGAGTCCC TTTGGCCCAC AGACAATGAG 
GCGAAACCCA CTCGGGCACG AGCGCTTCGC GCCGTGATGC TGGGCTCGTT CTCGCCGGAA 
AAGGGCCAAG ATGATGCCAT TCAGGCGGTG GCTTTAGCGC GGGCAGCCGG AGTTCAAATC 
GACCTCTCAC TGTATGGCTA TGCGCACGAA AGCGAAATTT TAAAATTGCA GGAGTGGTGC 
GACCGCCATG GTTTGAGTGA TCGAATCAGA CACAAAGGTT TCATCGATGA TCCTAAAGAG 
GCCTACGGTT CGGCGGATGT GTCGCTGGTT TGTTCCAAAA ATGAGGCTTA CGGAAGGGTG 
ACGGCGGAGT CGCTACTAAT GGGGGTACCC GTTGTGGGCT ACGAACTCGG TGGTACAACG 
GAAATCCTTA GGGCTGGTGG CGGAATTTCC TGCAAACCGA CATCTACAGA CCTAGCAAAT 
GTCCTAGTTT CATTAGCGGA AGACCCCAAC CTTCTGAATG ACCTCCATTC GCAGTGCCGG 
TCCCTCCGCG CTGACAGCGG GGAATTTGGG AATTCGGGGA GAACTGTTTC GCGTATGGTG 
GAAAAGATCA TCGGCGTTGG TGGCTAA

Protein sequence

MHVESLNLIE NRTRYSKRTD QTGGPGTSMK FVIASHSERL AGAERSLFAI VAAALEAGHE 
VVVTVPQQGA LQSKINVTFP DVQVIEIPTH SWMHGSRFTF KSVPRTLTSI LESIVHARLY 
RQISPDFIVI NSSVIPAPMI AAALCRIPSI VMVRESIRTN TQLFSIVPKS ILIRLIEGMS 
TFRFAVSHYV ADQLNQPCTV DFPDVRRDLG IESLWPTDNE AKPTRARALR AVMLGSFSPE 
KGQDDAIQAV ALARAAGVQI DLSLYGYAHE SEILKLQEWC DRHGLSDRIR HKGFIDDPKE 
AYGSADVSLV CSKNEAYGRV TAESLLMGVP VVGYELGGTT EILRAGGGIS CKPTSTDLAN 
VLVSLAEDPN LLNDLHSQCR SLRADSGEFG NSGRTVSRMV EKIIGVGG