Gene Arth_0515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0515
Symbol
ID	4447000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	549897
End bp	550727
Gene Length	831 bp
Protein Length	276 aa
Translation table	11
GC content	64%
IMG OID	639688312
Product	HAD family hydrolase
Protein accession	YP_830014
Protein GI	116669081
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01452] phosphoglycolate/pyridoxal phosphate phosphatase family [TIGR01457] HAD-superfamily subfamily IIA hydrolase, TIGR01457 [TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGT CAGACGAAGT ACGTTCATCA GCAGCGGTTT ACCGAAGCGG CCAGGAAATC 
GAATGCTGGC TGACTGACAT GGACGGCGTC CTGGTCCACG AAAACCAGCC GATCCCGGGC 
GCCGCTGAAC TGATCCAGCG CTGGGTGGAC ACCTCCAAGC GTTTCCTGGT GCTCACCAAC 
AACTCCATCT TCACGCCCCG CGACCTGGCC GCGCGCCTGC GTTCCTCCGG CCTGGAGATC 
CCCGAGGAGA ACATCTGGAC TTCGGCCCTG GCCACCGCCC AGTTCCTCAA GGACCAGGTG 
CGCGGCTCGG ATTCCGGGAA CCGCGCCTAC ACTATCGGCG AGGCAGGGCT TACGACGGCG 
CTGCACGAGG CCGGCTTCAT CCTCACCGAC CAGAACCCGG ACTTTGTGGT GCTTGGCGAG 
ACACGCACCT ACTCCTTCGA GGCCATCACG ATGGCCATCC GGCTAATCCT GGCAGGCGCC 
CGCTTCATCG CCACCAACCC GGATGCCACG GGCCCGTCCA AAGACGGCCC CATGCCCGCC 
ACCGGAGCCA TCGCGGCGCT GATTACCAAA GCCACCGGCC GTGAGCCCTA CATTGTGGGC 
AAGCCGAACC CCATGATGTT CCGTTCGGCC ATGAACCAGA TCGACGCCCA TTCCGAGACC 
ACCGCCATGA TCGGCGACCG GATGGACACC GACATCATCG CCGGCATGGA GGCCGGGCTG 
CACACGGTGC TGGTCCTCAG CGGAATCACC CACAAGGACG ACATTGCCGC CTATCCGTTC 
CGGCCCAACC AGATCCTGAA CTCGGTGGCA GACCTCAAGA GCCAGATCTA G

Protein sequence

MAESDEVRSS AAVYRSGQEI ECWLTDMDGV LVHENQPIPG AAELIQRWVD TSKRFLVLTN 
NSIFTPRDLA ARLRSSGLEI PEENIWTSAL ATAQFLKDQV RGSDSGNRAY TIGEAGLTTA 
LHEAGFILTD QNPDFVVLGE TRTYSFEAIT MAIRLILAGA RFIATNPDAT GPSKDGPMPA 
TGAIAALITK ATGREPYIVG KPNPMMFRSA MNQIDAHSET TAMIGDRMDT DIIAGMEAGL 
HTVLVLSGIT HKDDIAAYPF RPNQILNSVA DLKSQI