Gene Arth_4060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4060
Symbol
ID	4447791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4582718
End bp	4583830
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	65%
IMG OID	639691891
Product	oxidoreductase domain-containing protein
Protein accession	YP_833535
Protein GI	116672602
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCGT CACAGGAGTC CTACCGCCGG GACCTTGACC TTATGGCATC CGCGGCACCG 
CTGCGGGCCG CCGTGATCGG TGCCGGCTAC TGGGGGCCAA ACCTTGCCCG GAATTTCAAG 
GCCAGCCCGG ACTGGCAACT TGCAGCGATC GTGGACATGG ACCGCGACCG GGCCGCCAAG 
CTTGCGGCAG CCCACGGCGG CGTGCCGGTC TGCGAATCAA TTGACGAACT GCTGGACACC 
GTTGACGTCG ACGCGGTGGC CATTGCTACT CCGGCGCACA CCCACCACGG GATCGCCCTG 
ACAGCGTTGC GCGCGGGAAA GCACGTGCTT GTGGAAAAGC CCCTGGCCGA CAGCAGGGCC 
AAAGGCGTGG AGATGGTCGA AGAAGCAGAG AACCGCGGGC TGGTCCTGAT GGCCGACCAT 
ACGTACTGTT ACACCCCCGC CGTCCTGAAG ATCCGCGAAC TGATCGCGGA GGGCTCGTTG 
GGCGAGATCT TGTTCATCGA CTCGGTGCGC ATCAACCTCG GGCTTGTGCA GCCTGACGTT 
GACGTGTTCT GGGACCTGGC TCCGCACGAT CTGGCCATCA TCGATTTCAT CCTGCCCGGC 
GGCCTCCGTC CCGCTGAAGT GGCCGCCCAT GGAGCGGATC CGCTGGGAAC CGGACGGGAC 
TGCGTGGGGC ACCTGACGTT TGCGCTGCCG AACGATGCCA TGGCGCATGT GCACGTGAAT 
TGGCTCAGCC CTACCAAGAT CCGCCAGATG GTGGTGGGTG GTTCCCAGCG GACCCTCGTC 
TGGGATGACC TGAATCCGCA GCAACGGCTG AGTGTGTACG ACCGCGGCGT CAGCCTGGAC 
CGGAAATACC GTTCGCCCGC GGAGAAGAAG GCATTCGCCA TTTCCTACCG GCTGGGTGAC 
ACATGGGCGC CTGCGCTGCC GGAACACGAG GCCCTCGGCC AGATGGTGGC GGAATTCGCC 
AGCAGCATCT GGCATCACCG GCCTGCGCGG ACCAGCGGTA CCTCCGGGTT GCGGGTGCTC 
TCCGTTCTGG AAGCGGTCAG CCGCAGCCTC AGCGGTGATG GGGCCTCGGT CGCCGTCACG 
GGCAACGAAA CCCAGTTGGA GGGACGGCGA TGA

Protein sequence

MESSQESYRR DLDLMASAAP LRAAVIGAGY WGPNLARNFK ASPDWQLAAI VDMDRDRAAK 
LAAAHGGVPV CESIDELLDT VDVDAVAIAT PAHTHHGIAL TALRAGKHVL VEKPLADSRA 
KGVEMVEEAE NRGLVLMADH TYCYTPAVLK IRELIAEGSL GEILFIDSVR INLGLVQPDV 
DVFWDLAPHD LAIIDFILPG GLRPAEVAAH GADPLGTGRD CVGHLTFALP NDAMAHVHVN 
WLSPTKIRQM VVGGSQRTLV WDDLNPQQRL SVYDRGVSLD RKYRSPAEKK AFAISYRLGD 
TWAPALPEHE ALGQMVAEFA SSIWHHRPAR TSGTSGLRVL SVLEAVSRSL SGDGASVAVT 
GNETQLEGRR