Gene Arth_2684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2684
Symbol
ID	4444738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3007458
End bp	3008552
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	64%
IMG OID	639690504
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_832163
Protein GI	116671230
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTTCCT CTTCATCTTC CACCCGTCCC GGAGGTACCG TCCTGGTCAC GGGCGGCGCC 
GGGTTCATCG GCTGTGCGAT CTCCGATGCC CTGGTCAATG AGTTCGACCG CGTGGTCGTC 
GTCGACAATC TCCACCCGCA GATTCATGCC ACGGGCCAGC GGCCCGAGCA GCTTAACGCG 
GCAGCGGAAC TGGTGGTTGC GGATGTGACG GAAGCGAAGA CCTGGGACAC CGTCCTCCAG 
GACGTAACTC CCGACGTCGT TATCCACCTG GCGGCGGAAA CCGGCACCGG CCAGTCTCTG 
GAGGAGTCCA CCCGGCACGC GCACGTCAAT GTCGTCGGCA CCTCCCAGCT CCTCGACGGC 
CTCAACCGCC ACGGCAAGCT GCCCCGACGG ATCGTCTTGT CCTCCAGCCG TGCCGTGTAT 
GGCGAAGGCG CCTGGAAGGA TGCTCACGGC CGGGTCTTTT ACCCCGGTCA GCGGACAAGC 
GAAACCCTCG ACAAGGCACA GTGGGATTTC CCGGATGCCT CGCCCGTCGC GATGAAGGCG 
TCGGAGACGT TCCCGGCGCC CGTGAGCGTC TACGGTGCCA CGAAGCTCGC CCAGGAAAAT 
GTCCTCCAGG CATGGGCGAA GTCCTACGGC GTGGAGACCG TGATCCTCCG CCTGCAGAAT 
GTCTATGGTC CGGGCCAGTC CCTGATCAAC CCGTACACCG GCATCATGAG CCTCTTTTGC 
CGGATGGCCA TGGGCGGCAA GTCGATACCC CTTTATGAGG ACGGCGAAGT TCGCCGCGAC 
TTCATCCTGA TCGACGATGT CGCGTCGGCC ATTGTTGCCG GGGCGGTCTC CACCACCGTC 
CAGGCCGAAC CGATGGACAT CGGATCTGGC GAGTTCCAGA CCATCGGCAC CGCTGCAAAG 
CTGATCGCCG AACACTACAA AGCTCCTGCG TCGCACGTCA CCGGCCAGTA CAGGCAGGGC 
GACGTTCGTC ATGCCTGGGC TGACATCACG GCCGCCGAGA AGGTGCTGGG ATGGACCCCG 
AAGTACAACC TTGCCCAGGG AATCGAACGA CTGGCCACGT GGATTGACGC GCAGCCGGAT 
GTCAAGCCTG CCTGA

Protein sequence

MTSSSSSTRP GGTVLVTGGA GFIGCAISDA LVNEFDRVVV VDNLHPQIHA TGQRPEQLNA 
AAELVVADVT EAKTWDTVLQ DVTPDVVIHL AAETGTGQSL EESTRHAHVN VVGTSQLLDG 
LNRHGKLPRR IVLSSSRAVY GEGAWKDAHG RVFYPGQRTS ETLDKAQWDF PDASPVAMKA 
SETFPAPVSV YGATKLAQEN VLQAWAKSYG VETVILRLQN VYGPGQSLIN PYTGIMSLFC 
RMAMGGKSIP LYEDGEVRRD FILIDDVASA IVAGAVSTTV QAEPMDIGSG EFQTIGTAAK 
LIAEHYKAPA SHVTGQYRQG DVRHAWADIT AAEKVLGWTP KYNLAQGIER LATWIDAQPD 
VKPA