Gene Arth_3948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3948
Symbol
ID	4447766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4461659
End bp	4462732
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	639691779
Product	aldo/keto reductase
Protein accession	YP_833423
Protein GI	116672490
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTCA ACCAGCTACG GGTGTTCGGG CGCAGCGGGA CATTGATCAG CCCGCTCACT 
TTGGGGACCA TGAACTTCGG CGAGGGCGCA CGGGCGGACC CGGCGGGCGC CGGCGGAACC 
GCCCAGGGCT ATGCGCCCAC CGGCGCCGAT GAAAGCATCC GCATCATCAA CGCTGCCCTG 
GACGCCGGCA TCACCGCCGT GGACACGGCG GACGTCTACT CGCAGGGGCA GAGCGAACAG 
GTGGTGGGCC GCGCCCTGAA GGGCCGCCGC GACGATGTTT TCATTGCCAC CAAATTCCAC 
GGCCAGATGA GCGCCAACCC GGCCCACTCC GGCAACTCGA GGCGCTGGAT CATGCAGGCA 
GTGGAGGGCA GCCTCCGCCG CCTGCAGACG GACCGGATCG ACCTGTACCA GGCGCACCGT 
CCCGACTACA ACACCGACGT CCTGGAAACC ATCACGGCAC TGAACGACCT CATCCGCCAA 
GGCAAGATCC TCTACTACGG AACGTCCGTT TTCACTCCGG CGCAGCTGGT GGAGGCCCAG 
TGGCTGGCAA CCACCAACCA CCTCATCCCG CCCGTCGCCA ACCAGGTCCC CTATTCCATG 
CTGGTCCGGG GCACCGAGCG TGATGTCCTG CCGATCGCCC AGCAGTACGG GCTCGGAGTG 
CTGGCCTACG GTCCGCTGGC CGGCGGCTGG CTGTCCGGGA GCTTTGTCCT GGATGCCGGG 
AAGCCGCCCA CGCGCGTTCA CTCGCTTCCC GGACGGTACG ACATTTCCGG CCCGGCGAGC 
GAGCGCAAGC TGCACGCCGC AGATGCCCTG GCCAGGCTGG CGGACAAGCT GGAACTTCCG 
CTGGTGGACC TGGCAGTCGG CTTCGCGCTG AACCACCCGG CTGTCAGCAG TGTGATCATT 
GGGCCGCGGA GCGAGGAGCA CCTGCACGCC TACCTGAAGG CTGCGGACAC GGTGCTGGAC 
GAATCCGTGC TGGATGCCAT CGACGAGCTG GTGCCCCCGG GCACCAATTT CGTGGAGCGG 
GACGCCGGCG CCGTGGTCCC CTCCCTGGAG TATGCGGAGC TCCGGCGAAG GTAG

Protein sequence

MSLNQLRVFG RSGTLISPLT LGTMNFGEGA RADPAGAGGT AQGYAPTGAD ESIRIINAAL 
DAGITAVDTA DVYSQGQSEQ VVGRALKGRR DDVFIATKFH GQMSANPAHS GNSRRWIMQA 
VEGSLRRLQT DRIDLYQAHR PDYNTDVLET ITALNDLIRQ GKILYYGTSV FTPAQLVEAQ 
WLATTNHLIP PVANQVPYSM LVRGTERDVL PIAQQYGLGV LAYGPLAGGW LSGSFVLDAG 
KPPTRVHSLP GRYDISGPAS ERKLHAADAL ARLADKLELP LVDLAVGFAL NHPAVSSVII 
GPRSEEHLHA YLKAADTVLD ESVLDAIDEL VPPGTNFVER DAGAVVPSLE YAELRRR