Gene Arth_3453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3453
Symbol
ID	4443851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3886069
End bp	3887100
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	67%
IMG OID	639691277
Product	Aryl-alcohol dehydrogenase (NADP(+))
Protein accession	YP_832928
Protein GI	116671995
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.970161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATACC GCACACTAGG CAACAGCGGC GCCGTCGTTT CCAATTACGC GCTGGGCACC 
ATGACCTTTG GCGCAGAGGC CACCGAGGAA ACATCCTTCG CCATTCTTGA CGACTACTTT 
GCAGCAGGTG GCAACTTCAT CGATACTGCG GACGTCTACA GCCAGGGCGT CTCGGAAGAG 
ATCATCGGCC GCTGGCTGGC CGCCCGTCCC GACGTCAAGG ACCGCGCCGT TCTGGCCACC 
AAGGGACGCT TCCCCATGGG GCAGGCCCCG AACGACCTCG GAACCTCCCG CCGCCACCTC 
ACCCGGGCGC TGGACGACTC GCTGCGCCGT CTCGGCGTCG AACAGATCGA CCTGTACCAG 
ATGCACGCGT GGGACCCCAT TACGCCCCTG GAGGAGACGC TGCGCTTCCT GCATGACTCC 
GTCAGCAGCG GCAAGATCGC CTACTACGGG TTCTCCAACT TCCTGGGCTG GCAGCTGACC 
AAGGCGGTGC ACCTGGCCAA GGCCCATGGC TGGAGCGCGC CGGTAACACT GCAGCCGCAG 
TACAGCCTGC TGGTCCGGGA GATCGAATCA GAGATTGTTC CTGCGTCACT GGACGCGGGG 
ATCGGGCTGC TGCCGTGGTC CCCCCTTGGC GGAGGCTGGC TCTCCGGCAA ATACAAGCGC 
GATGAGGCTC CGGCCGGCGC GACCCGGCTG GGCGAGAACC CCAAGCGCGG CATGGAAGCC 
TGGCAGGCCC GCAACGACGA TCCCCGCACC TGGGAGGTCA TCGGAACGGT CGAGAAGATC 
GCGGCGGACC ACGGAGTGAG CGCATCCCAG GTGGCACTGG CCTGGCTGGC GGACCGGCCG 
GCGGTTACGT CCGTGATCCT CGGCGCCCGC ACCACGGAGC AGCTGGCGGA CAACCTCGCA 
GCCGCGGACC TGGAGCTGAC GGAGGAGGAG ACCCGGCGGC TGACCGAGGC CAGCCAGCCA 
CGGGTGGGCG TGTACCCGTA CGGTCCCATG GCCCAGGAGC AACGCAACCG GAAGATTGAG 
GGCGGCCGGT AG

Protein sequence

MQYRTLGNSG AVVSNYALGT MTFGAEATEE TSFAILDDYF AAGGNFIDTA DVYSQGVSEE 
IIGRWLAARP DVKDRAVLAT KGRFPMGQAP NDLGTSRRHL TRALDDSLRR LGVEQIDLYQ 
MHAWDPITPL EETLRFLHDS VSSGKIAYYG FSNFLGWQLT KAVHLAKAHG WSAPVTLQPQ 
YSLLVREIES EIVPASLDAG IGLLPWSPLG GGWLSGKYKR DEAPAGATRL GENPKRGMEA 
WQARNDDPRT WEVIGTVEKI AADHGVSASQ VALAWLADRP AVTSVILGAR TTEQLADNLA 
AADLELTEEE TRRLTEASQP RVGVYPYGPM AQEQRNRKIE GGR