Gene Arth_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0231
Symbol
ID	4447322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	242698
End bp	244047
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	70%
IMG OID	639688027
Product	Tat-translocated enzyme
Protein accession	YP_829732
Protein GI	116668799
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01412] Tat-translocated enzyme [TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGGGACA CCTCCCAGGC CCCGGCCTCA GCTGACAGCG CCCCCAACGG TGCCGCGGAC 
GCCAAAGCCG CCGCCGCCCG CGGCGTTTCT CGACGGGGCC TGCTTTCTTT CGCCGGGGTC 
GGTGGCGCCG GGGCGCTTGC CGGAATTGCC GCCGGGCTGT GGGGCCGCGA CGCCGTCTTC 
GCGGCAGAGC CGGCCGTGGA ACCGGCTGAT GACACCGTCC CGTTCCACGG GGAGCGCCAG 
GCCGGAATTA CGACGGCGGC GCAGGACCGG CTGCACATGG CGGCCTTCGA TGTCCTCACC 
GAGGACCGCG ACGAGCTGAT CCGGCTGCTC AAGGACTGGA CGGCCGCCTC GGAGGCCATG 
ACGCAAGGCC GCGAAACCGG CGAAACCGGC GCGGCCGGCG GCTCCTATGA CGCCCCGCCG 
CAGGACACCG GCGAGGCCTT GGGACTCAGC GCCGGCAAGC TCACCGTGAC CTTCGGCTTT 
GGTGCCAGCC TGTTCGAAAA GGACGGAAAG GTGCGGTTCG GGCTCGAGGG CAGGCGCCCT 
GATGCCCTCA TCGACCTGCC GCATTTCCCG GGCGATGACC TGCAGGCGGG ACGCAGCGGC 
GGGGACATCA TCGTGCAGGC CTGCGCTGAC GATCCCCAGG TGGCCGTCCA CGCCGTCCGC 
AACCTGGCCC GGCTGGGGTT CGGCAAGGTC CGCGTCCGCT GGTCCCAGCT GGGCTTCGGG 
CGCACGGCCT CCACGTCCCG CGCACAGCAG ACGCCCCGCA ACCTGTTCGG TTTCAAGGAC 
GGCACCAACA ACCTCAAGGT CGAAGACACG GAGCTGCTGG AGAACCACGT CTGGGCCGGG 
GCAGGCACCC GGCCCGGAGA AGCCTGGATG GAGGGCGGAA GCTACCTTGT GGCCCGCCGC 
ATCCGCATGC ACATCGAGAT CTGGGACCGG ACGTCCCTGG GCGAGCAGGA AGCCCTGATC 
GGACGGACCA AGGCCGAGGG CGCCCCGCTG TCCGGCGGCA AGGAATTCAC CGCCCCTGAT 
TTCACCATCA AGGGCAAGGA CGGCAAGCCC CTGATGGGCT TGGACTCACA TGTCCGGCTG 
GCCCATGCCG ACCAGAACGG CGGGGTCCGG ATGCTGCGCC GCGGGTACAA CTACACGGAC 
GGATCCGACG GGCTTGGGCA CCTCGACGCC GGGCTGTTCT TCATCGCCTT CGTCAAGGAC 
CCGCGCACGC ACTATGTGCC CATGCAGATG GCGATGGCCA AGCAGGACAC CCTGGCCGTG 
GAGTACCTCA AGCACACCGG CTCCGCCCTG GCCGCGGTGC CGCCGGGCAC GAGGCCCGGC 
GGCTTCCTCG GAGAAGGCCT CTTCAGCTGA

Protein sequence

MGDTSQAPAS ADSAPNGAAD AKAAAARGVS RRGLLSFAGV GGAGALAGIA AGLWGRDAVF 
AAEPAVEPAD DTVPFHGERQ AGITTAAQDR LHMAAFDVLT EDRDELIRLL KDWTAASEAM 
TQGRETGETG AAGGSYDAPP QDTGEALGLS AGKLTVTFGF GASLFEKDGK VRFGLEGRRP 
DALIDLPHFP GDDLQAGRSG GDIIVQACAD DPQVAVHAVR NLARLGFGKV RVRWSQLGFG 
RTASTSRAQQ TPRNLFGFKD GTNNLKVEDT ELLENHVWAG AGTRPGEAWM EGGSYLVARR 
IRMHIEIWDR TSLGEQEALI GRTKAEGAPL SGGKEFTAPD FTIKGKDGKP LMGLDSHVRL 
AHADQNGGVR MLRRGYNYTD GSDGLGHLDA GLFFIAFVKD PRTHYVPMQM AMAKQDTLAV 
EYLKHTGSAL AAVPPGTRPG GFLGEGLFS