Gene Arth_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1041
Symbol
ID	4446476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1118158
End bp	1119147
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	69%
IMG OID	639688844
Product	aldo/keto reductase
Protein accession	YP_830535
Protein GI	116669602
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGC AGCCCGAAGG CGCCCAGGTG GACGGCCTGA AACTTCCCAT TTCCCGGCTG 
GTCCTGGGGA CCATGACGTT CGGCGACACG GTCGACGAGG CCACCGCGGG GCGGATGGTG 
GAGGAAGCGC TCGACGCCGG CATCACCACG ATCGACACCG CCAACGCCTA CGTCGGGGGA 
ACCACCGAGG AAATGCTCTC CCGCCTCCTC AAGGGTCGCC GCGGCGACGT TATTCTCGCC 
TCCAAGGCGG GCATGCCGCA CGCGGACCAC GGCTCCAACT CGCCGTTGTC GCCCGCGGGT 
CTGCGTGCCA GCGTGGAGGG GAGCCTCCGC CGGCTCGGCG TGGACAGCAT CGACCTGTTC 
TACCTGCACC AGCCGGACCG CGCCACGCCG CTGCGCGACA CACTGGCCAC CGTGGCCGAG 
CTGTTCGCCG AGGGGAAGAT CTGCGCGCTG GGCGTGTCCA ACTTCGCGGC CTGGCAGATT 
GCCGACGTCA TCCACACGGC ACGCGAAGTG GGGGCGCCGC GGCCGGTGGT CGCGCAGCAG 
CTGTACAACC TGGTGGCACG CCGGGTGGAG GAGGAATACC TCGAATTCGC CGCCACCCAC 
AACGTGCACA CCATGGTCTA CAACCCCCTG GGCGGCGGGC TGCTCACCGG CAAGCACAGC 
TTCGACGCCA AGCCCACCGA GGGCCGCTAC GGCGACTCCA AGCTGGCCGC CATGTACACC 
CAGCGGTACT GGGACAAGCA GCTGTTCGAC GCCATTGAAG AGCTCTCCCG CATCGCTGAC 
GGTGCAGGGA TTTCCCTGGC CGAGCTGTCG CTGCGCTGGC TGGCCTACCG GGACGGCGTG 
GGCTCCATGC TGCTGGGCGG CTCCAAGGTG GAACAGCTGC AGTCCAACAT CGCCGCCGTC 
GCCAACGGGC CGCTGCCCGC CGACGTCGTG GACGCCTGCG ACGCCGTGGG CACCTCGCTG 
CGGGGCCCCA TGCCCGCCTA CAACCGCTGA

Protein sequence

MSKQPEGAQV DGLKLPISRL VLGTMTFGDT VDEATAGRMV EEALDAGITT IDTANAYVGG 
TTEEMLSRLL KGRRGDVILA SKAGMPHADH GSNSPLSPAG LRASVEGSLR RLGVDSIDLF 
YLHQPDRATP LRDTLATVAE LFAEGKICAL GVSNFAAWQI ADVIHTAREV GAPRPVVAQQ 
LYNLVARRVE EEYLEFAATH NVHTMVYNPL GGGLLTGKHS FDAKPTEGRY GDSKLAAMYT 
QRYWDKQLFD AIEELSRIAD GAGISLAELS LRWLAYRDGV GSMLLGGSKV EQLQSNIAAV 
ANGPLPADVV DACDAVGTSL RGPMPAYNR