Gene Arth_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2139
Symbol
ID	4445216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2409657
End bp	2411108
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	64%
IMG OID	639689947
Product	putative short chain dehydrogenase
Protein accession	YP_831619
Protein GI	116670686
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.538588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTCCT CCGATTTGAC GCCTGAGGAC ATCCAGGCCT GCCTCAAGGT TCTTAACACC 
ATCCACGCCT ATGACGAGGA GCACCCGGAC TACGTCTCGG TTCGACGCGC CACGGGCAAG 
ATGTTCAAGG CTGTCAAACG CCACCGCCGG GTCACCAAGC GCGACCTGAT CGCAGAGTCC 
GATCGCGCAG TCATCGCCCA GACGGCTACG GCAGCGCCGG ACCGGATCGA TGACGAAACC 
CGCGGGAACA AGCTGGAACC CTCTGCGACC GGCAAGGTGG CCGGACACCT CATCAGGTCC 
CGCCCGTGCT ACATCTGCAA GAATCACTAC ACGCAGGTTG ATGCCTTCTA TCACCAGTTG 
TGCCCTGAGT GCGCTGCGTT CAGCCACAGC AAGCGCGACG CGCGGACGGA CCTCACCGGC 
CGGCGTGCCC TCCTTACGGG AGGTCGCGCC AAAATCGGCA TGTACATCGC CCTGCGGCTG 
CTGCGGGACG GTGCCCACAC CACCATCACC ACCCGGTTCC CGAAAGATGC GGCCCGACGC 
TTCGCCGCGA TGGAGGACAG CGGTGAGTGG CTCCATCGGC TCAGGATCGT GGGCATCGAC 
CTTCGTGATC CCTCCCAGGT AATGGCCCTG ACGGATTCCC TCGACGCCGC GGGCCCGCTG 
GACATCATCA TCAACAATGC GGCCCAGACG GTCCGCCGCT CCGGCAACGC CTACAAGCCG 
CTGGTCGATG CAGAGGACGA GCCCCTGCCG GCCGCCCTCG ACGCTGCCAA CGGCGGACCG 
GAACTGGTGA CCTTCGGCCA CGCCCACGAC AAGCACCCGT TGGCCCTTGC CAGCAGCGTC 
ATGGAACACC CGGTCCTGGC CGGCGACGCC ATCACATCCC TGGCACTCTC TACGGGTTCG 
GCTTCGCTGG AACGGATAGC CACCGGCACG GCCATCGACG CCGGCGGGCT GGTTCCTGAC 
CTGGCCACCA TCAACAGCTG GACGCAGGTG GTGGATGAAG TGGACCCGCT GGAGATGCTC 
GAAGTTCAGC TCTGCAACGT GACGGCGCCC TTCCTGCTCG TGAGCCGTCT GCGTGCCGCC 
ATGAAGCGCT CCACCGCGCA CCGGAAGTAC ATCGTGAACG TTTCCGCCAT GGAAGGGCAG 
TTCTCACGCG CATACAAGGG TCCGGGCCAC CCCCATACCA ACATGGCCAA AGCGGCGCTA 
AACATGATGA CCCGCACCAG CGCGCAGGAA ATGCTCGATT CCGACGGCAT CCTGATGACC 
GCCGTGGACA CCGGATGGAT CACTGATGAG CGTCCGCATT ACACCAAGGT CAGGCTCATG 
GAGGAAGGCT TCCATGCTCC GCTGGACCTC GTGGACGGTG CAGCGAGGGT CTACGATCCG 
ATTGTCATGG GAGAAAACGG CGAAGACCAG TACGGCGTCT TCCTCAAGGA CTACAAGCCC 
AGCCCCTGGT AG

Protein sequence

MNSSDLTPED IQACLKVLNT IHAYDEEHPD YVSVRRATGK MFKAVKRHRR VTKRDLIAES 
DRAVIAQTAT AAPDRIDDET RGNKLEPSAT GKVAGHLIRS RPCYICKNHY TQVDAFYHQL 
CPECAAFSHS KRDARTDLTG RRALLTGGRA KIGMYIALRL LRDGAHTTIT TRFPKDAARR 
FAAMEDSGEW LHRLRIVGID LRDPSQVMAL TDSLDAAGPL DIIINNAAQT VRRSGNAYKP 
LVDAEDEPLP AALDAANGGP ELVTFGHAHD KHPLALASSV MEHPVLAGDA ITSLALSTGS 
ASLERIATGT AIDAGGLVPD LATINSWTQV VDEVDPLEML EVQLCNVTAP FLLVSRLRAA 
MKRSTAHRKY IVNVSAMEGQ FSRAYKGPGH PHTNMAKAAL NMMTRTSAQE MLDSDGILMT 
AVDTGWITDE RPHYTKVRLM EEGFHAPLDL VDGAARVYDP IVMGENGEDQ YGVFLKDYKP 
SPW