Gene Arth_3338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3338
Symbol
ID	4444067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3751753
End bp	3752721
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	68%
IMG OID	639691161
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_832813
Protein GI	116671880
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGGA TTTTTGTCAC CGGCGGCTCC GGCCGGCTTG GGCGCAGTGT TGTTGCCGGC 
CTCGCCGGCG CAGGCCACCA CGTCATCTCC GTGGACCGCG ACGCTGTTCC CGCCGCCCAG 
CTGCCCGACG GCGTCGAGCA GCGCACGGCC GACCTCCTGG CGCCCGGGGA GGCGGAACGC 
CTCCTGCGCG AAACAACGCC CGACGCCGTC GTCCACCTCG CGGCGATCGC CGTGCCGTTC 
AGCGCGCCGG AAGACGTCAT CTTCAGCACC AACACAAGGC TGGCGTACGC CGTCATCAGC 
GCGGCCACCG AACTGCGTAT CGGCAAGATC GTCACGGCAA GCAGCCCCAC GGTACTGGGC 
TATGGCTCGC CCGCGGGCTG GCTGCCGGAG AGCTTCCCGG TGGACGAGCA AACCACGCCG 
CGGCCCTGGA ACGCCTATGC ACTGTCCAAA CTCATCGCTG AACAGACGGT GCAGATGTTC 
GCCGCAGCGC AGGGGGATGA TATCCGCTAT GCGGCCTTCC GGCCCTGCTA TGTGATCTCG 
CCCGAGGAAT GGGCGGGCGC GCCCACCCAG CAGGGCCACA CCGTCCGTGA ACGGCTGGAT 
GATCCCGCGT TGTCCGCGCC CGCGCTCTTC AACTACGTGG ATGCGCGGGA TGTGGCGGAC 
TTCCTGGACC TGCTGCTCGC CAAGATGGAT AGCATCCCCA ACGGCCAGAC CTTCTTCGTG 
GGGGCAGCGG ATGCGCTGGC CACCGCACCG CTTGCGGAGC TGATGCCCCG GTTCCTGCCC 
GGCAGCTCGG AGCTTGCCGC GGGACTCACG GGCACCAGCC CGGCATTCTC GATCACCAAG 
GCCCGTGAAC TGCTCGGCTG GGAACCCAAA CGCAACTGGC GGACCGAACT GAAGACTGAA 
ACCACGCTCA ACGACGAGAC CCCTGCCGTG CTGGTCGCGG CCGGCACAGG ATCAAAGGAG 
ACCCCATGA

Protein sequence

MSRIFVTGGS GRLGRSVVAG LAGAGHHVIS VDRDAVPAAQ LPDGVEQRTA DLLAPGEAER 
LLRETTPDAV VHLAAIAVPF SAPEDVIFST NTRLAYAVIS AATELRIGKI VTASSPTVLG 
YGSPAGWLPE SFPVDEQTTP RPWNAYALSK LIAEQTVQMF AAAQGDDIRY AAFRPCYVIS 
PEEWAGAPTQ QGHTVRERLD DPALSAPALF NYVDARDVAD FLDLLLAKMD SIPNGQTFFV 
GAADALATAP LAELMPRFLP GSSELAAGLT GTSPAFSITK ARELLGWEPK RNWRTELKTE 
TTLNDETPAV LVAAGTGSKE TP