Gene Arth_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1950
Symbol
ID	4445534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2200315
End bp	2201457
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	64%
IMG OID	639689760
Product	oxidoreductase domain-containing protein
Protein accession	YP_831432
Protein GI	116670499
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTGC CTTCTGCGGA ATCGGTCCGG ACCATTCGTT ACGGCCTTAT CGGTGCCGGC 
CACATGGCCC GCGAACACGT CCGGAACCTT GCCCTGATCC CGGGAAGCCA CATCACCGCC 
GTATCCGATC CCCAGCCGTC ATCGCTGGCG GAGACCGTTG CGGAAATCGG CTACGAGGTA 
CAGACCTTCT CCCGTCACCA GGACCTGCTC GCGTCCGGAC TGGTGGATGC ATTGGTGATC 
GCCAGCCCCA ACGACACGCA CCTGGCCATC CTCAAGGACA TCTTCGCGAG TGGCACCAAC 
CTGCCCGTGC TGGTGGAGAA GCCCGTGTGC ACCACTGCGG AACAGGCCGA CGAGCTTGAA 
GCGCTGGCAG CTGACTACAC CGCGCCGGTG TGGGTTGCCA TGGAGTACCG CTACATGCCG 
CCGGTGCAGG AAATCATCCA GGCGGCCCAC GGCGGCAGGC TCGGCAACGT GTACATGCTA 
TCCATCGTGG AGCACCGCTT CCCGTTCCTG CACAAGGTGG ACGCCTGGAA TCGCTTCACG 
GAGCGGACCG GAGGCACGCT GGTGGAAAAG TGCTGCCACT TCTTCGACCT GATGCGGCTG 
ATCCTGCAGG ACGAACCCGT GCGCGTCTAC GCCAGCGGCG GCCACGACGT CAACCACATG 
GACGAGGTGT ATGACGGCAG GGTGTCAGAC ATGATCGACA ACGCCTACGT GATTGTGGAC 
TTCAAGGGCG GGCGCCGGGC CATGCTGGAG CTGTCCATGT TCGCGGAGGG CTCCAAGTTC 
CAGGAGCGGA TCTCCATTGT GGGCGACGCC GCCAAGATCG AGACCCTCAT CCCGGTGGCG 
GCCAACCACT GGATCGAGGG CGACGAGGCC GAGGCGACGG TGGAATTCAG CCCGCGCTCG 
CCGCTGGGGC CGGAAATGCA CGAGGTTCCT GTAGATGAGG CCGTCCTCGC TGCCGGCGCC 
CACCACGGCT CCACGTACTA TGAACACCTT GGCTACCGCA AAGCCATCCT GGGTGACGGG 
CCGGTGGAAG TTACGGTTGC CGACGGCCTG CAGTCCGTGC GCATGGGCTT GGCGGCCGAG 
CGCTCCATCA TCGAAGGACG CCCCGTAGAG CTGACGAATG CCGGTGCCGG GCTCAGTCAC 
TGA

Protein sequence

MSLPSAESVR TIRYGLIGAG HMAREHVRNL ALIPGSHITA VSDPQPSSLA ETVAEIGYEV 
QTFSRHQDLL ASGLVDALVI ASPNDTHLAI LKDIFASGTN LPVLVEKPVC TTAEQADELE 
ALAADYTAPV WVAMEYRYMP PVQEIIQAAH GGRLGNVYML SIVEHRFPFL HKVDAWNRFT 
ERTGGTLVEK CCHFFDLMRL ILQDEPVRVY ASGGHDVNHM DEVYDGRVSD MIDNAYVIVD 
FKGGRRAMLE LSMFAEGSKF QERISIVGDA AKIETLIPVA ANHWIEGDEA EATVEFSPRS 
PLGPEMHEVP VDEAVLAAGA HHGSTYYEHL GYRKAILGDG PVEVTVADGL QSVRMGLAAE 
RSIIEGRPVE LTNAGAGLSH