Gene Arth_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1514
Symbol
ID	4445980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1686998
End bp	1687990
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	639689328
Product	HAD family hydrolase
Protein accession	YP_831008
Protein GI	116670075
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGTG CTTCATTGAT TTCCCGGTTC GACGCCCTGC TGTCCGATCT CGACGGGGTT 
GTCTATGCCG GTCCTCACGC CATCCCGGGC GCCGTTGAGG CGCTCCGCCA ACTGGCGGGA 
ATCGACGTCG GACTTGGGTA CGTGACCAAT AACGCCTCCC GGACTCCCGC GCAGGTGGCG 
GCGCACCTGC GCGAGCTTGG CGCGCCTGCC GAAGACGCGC AGGTGGTCAG TTCCTCGCAG 
GCTGCCGGCG AGCTGCTGGC GGGACTTCTT CCGGCGGGGG CGCGGGTCCT GGTGACCGGA 
AGCCCGGCGC TGGCGCATGA GGTGGAGCTG GTGGGGCTGA CACCCGTTCA CAGCGCCAAG 
GAAAAGCCGG TGGCGGTGGT CCAAGGATTC AATCCCGAGA TCGGTTGGAA GGACCTCGCT 
GAGGCTTCGT ACGTTATCGC CGGCGGCGCC CTGTGGGTTG CCACCAACAC GGACATGTCC 
ATCCCGCAGG CCCGCGGCAT GGCTCCTGGC AACGGAACCC TGGTGGCTGC CGTAGCTGCG 
GCCACCGGAC AGCAGCCCCT GGTGGCCGGG AAGCCCGAGG CTCCGTTGTT CCGCACCGCC 
GCCAAGCGGC TCACCTCCGA ACGGCCGCTC GTCGTGGGCG ACCGGCTGGA CACCGACATC 
CTCGGCGGGA ACAACGCCGG GTTTGCCACG GTGGCAGTGC TCACCGGCGT CGACACCCGG 
GAATCCATCC TCGCCGCCCG CACGGCCGAG CGGCCGGACT TCCTCATCAA TGACCTCAGC 
GATCTGTACC GCCCGTACCC CGCTGTGGAA GAGCACGACG GCGGCACGTT CCGTTGCGGT 
TCGGCCTCCG CCGTCGTGCG CGGAGAGTCG GTCCACATCA GCGGAATCCC GGGAGACCTC 
GACTCGTGGC GGGCAGCCTG TTCGGCGTGG TGGACGGCCA ATCCGCAGGC AGACGCTGCC 
CTGGCCCCTG CCATCGAGTG GCTGACGGAC TAA

Protein sequence

MSGASLISRF DALLSDLDGV VYAGPHAIPG AVEALRQLAG IDVGLGYVTN NASRTPAQVA 
AHLRELGAPA EDAQVVSSSQ AAGELLAGLL PAGARVLVTG SPALAHEVEL VGLTPVHSAK 
EKPVAVVQGF NPEIGWKDLA EASYVIAGGA LWVATNTDMS IPQARGMAPG NGTLVAAVAA 
ATGQQPLVAG KPEAPLFRTA AKRLTSERPL VVGDRLDTDI LGGNNAGFAT VAVLTGVDTR 
ESILAARTAE RPDFLINDLS DLYRPYPAVE EHDGGTFRCG SASAVVRGES VHISGIPGDL 
DSWRAACSAW WTANPQADAA LAPAIEWLTD