Gene Arth_1936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1936
Symbol
ID	4445520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2180740
End bp	2181816
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	67%
IMG OID	639689746
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_831418
Protein GI	116670485
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCTGG CTTTTGAGCA TGTGACTCTG GGCCAGCGTG TCCTCTTCGG CACCGGCACG 
GCCGCTCCGA GCCTCGCCTC CGAAGTGGCC CGCCTAGGTG CGCGGCGCGT GATGGTGATC 
ACCTCGAACC GCGCGAGGGA AACGGCATAC AGAATAGCTG CCGACGTCGA GGTGGCGCTG 
TGGCACCACG ACGTGGCGAT GCACGTGCCC ATAGAAACCG CACGGAAGGC CCGCGCCGCC 
GCGGGTGAGC ACGGCATCGA CCTGCTTGTC TGTGTGGGCG GGGGTTCGAC GACGGGACTC 
GCTAAGGCGA TCGCGATGAC CTTGCGCCTG CCGATCATTG CCGTGCCCAC CACCTATGCG 
GGCTCGGAAG CCACCAACGT GTGGGGCCTA ACCGAAGCAT CTCGAAAAAC CACCGGAGTG 
GACGATGCCG TCCTGCCCGT CACCGTCATC TACGACGCGG CACTGACGCT AGCCCTGCCG 
GTGGCCATGT CCGTTGCCTC CGGACTGAAC GGCATTGCAC ACTGCATCGA CTCCATGTGG 
GCCCCCGGCG CAGACCCCAT CAACGCAGCG CTCGGCGCCG AAGGCATCCG CGCCCTCAGC 
CACGGCCTGC CCCTCATCGC CGAAGACCCC GCAGGTACCG AGGGGCGCGA GCAGGCCCTG 
TATGGCGCCT ACCTCTCCGC CGTCGCGTTC GCGTCCGCCG GCTCCGGGTT GCACCACAAA 
ATCTGCCATG TCCTGGGCGG CGCTTTCAAC CTCCCCCATG CCCAGGTCCA CGCCACCGTA 
CTTCCTTACG TTCTCGCGTT CAACGCCCCC TATGCTTCCG ACTCCGAAGC TCGCATCGCC 
GCAGCGTTCG GCACAGCCGA CGCACTGACC GGACTACAGG AACTGCGCAA TCGTCTTGAC 
GCACCCAAAG CTCTGTCTGA CTACGGTTTG ACCGCGGACG GGGCCGCCGA AGCCGCCGCC 
GTCGTCCAGC CGACCGTACC GGCATCGAAC CCCCGCCCCG TCACGACCGA GAACCTCACC 
CGCCTCCTCC AGGCAGCACT GAGCGGCGAG GACCCCCGGT GCCTCCTGGA GCATTGA

Protein sequence

MGLAFEHVTL GQRVLFGTGT AAPSLASEVA RLGARRVMVI TSNRARETAY RIAADVEVAL 
WHHDVAMHVP IETARKARAA AGEHGIDLLV CVGGGSTTGL AKAIAMTLRL PIIAVPTTYA 
GSEATNVWGL TEASRKTTGV DDAVLPVTVI YDAALTLALP VAMSVASGLN GIAHCIDSMW 
APGADPINAA LGAEGIRALS HGLPLIAEDP AGTEGREQAL YGAYLSAVAF ASAGSGLHHK 
ICHVLGGAFN LPHAQVHATV LPYVLAFNAP YASDSEARIA AAFGTADALT GLQELRNRLD 
APKALSDYGL TADGAAEAAA VVQPTVPASN PRPVTTENLT RLLQAALSGE DPRCLLEH