Gene Arth_4363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4363
Symbol
ID	4443474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008538
Strand	+
Start bp	102943
End bp	104406
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	61%
IMG OID	639687684
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_829381
Protein GI	116662327
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000470921
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGATC AGACCAGCGT CATCCAGGAC GTGCAACGAG GCATGATTCC TGCACACATC 
TACAACGACA AGGAGATCTT CGAACTCGAA AAGGAGCGCC TCTTCGGACG GAGCTGGCTC 
TTCGTCGCCC ATGAGTCGGA GGTGCCAGAA GCCGGCGACT ACGTGGTGCG CCGCGTGCTG 
GAAGACTCAT TCATCATTTC CCGCGACGAG CAGGGCGAAA TCCGCGCCCT CTTCAATATG 
TGCCTGCACC GCGGAATGCA GGTCTGCCGG GCCGAAATGG GAAACGCCTC GCATTTCCGT 
TGCCCCTACC ACGGCTGGTC CTACCGCAAT GACGGACGCA TTGTGGGCCT GCCGTTCCAT 
AAGGAGGCCT ACGGCGGCGA AGAGGGCTTC AAGAAAAAAG GGCAGACCCT GCTTCCCGCC 
CCGTCCCTGG GCGTATATAA CGGGCTGATT TTCATTAGCC TTGACCCCGA CGCGGAACCC 
CTCGAGGACT TCCTGGGCGA CTTCAAGTTC TACATGGACT ACTACACCAA GCAAAGTGCT 
GACGGCATTG AACTCCGCGG CCCTCAGCGG TGGCGGGTCA AGGCGAACTG GAAGATCGGT 
GCCGAAAACT TCGCCGGCGA CATGTACCAC ACGCCCCAAA CGCACACGTC GGTGGTTGAA 
ATTGGCCTCT TCCGCGAGCC AAAGGCGGAG AAGCGCAAGG ATGGCACAAC GTACTGGGCC 
GGTAACGGCG GCGGAACCAC CTACAAGCTT CCCGAAGGCA CCCTGGAAGA CCGGCTGCGC 
TACGTCGGTT ACCCGGACGA CATGATCGCG CGGATGAAGG AACAATGGAG CCAGGAGCAG 
CTCGATGTCG TGGGCAAGGA CGGGTTCATG GTCTCGGCCG CCTCGGTCTT CCCAAACATG 
AGCTTCGTCC ATAACTGGCC CCGTGTAGAA GAAGACTCCG ACGAAGTTCT CCCATTTATC 
TCCATCCGCC AATGGCAGCC CATCAGCGAA GACGAGACCG AGATCGTTTC CTGGTTCGCC 
GTGGACAAGA ACGCGTCCGA GGAATTCAAG GCGCTTTCGT ACAAGGCCTA TCTCATGTGC 
TTCGGCAGCG GCGGCATGTT CGAACAGGAT GACGTTGAAA ACTGGGTCTC GCTGACGAGC 
ACGGCGGGTG GCCCGATGGC CCGCCGCCTG CTGCTCAACA GCCGTATGGG CATGCTGGAA 
AACGGGCAGA ACGTTGTAGA ACCGCTGACC TCCGATGAGT ATTCAGGGCC AGGTTCCACC 
CGGATCGGCT ACAGCGAATA CAACCAGCGT GAACTGCTGC GGCGGTGGGC CGACCACTTG 
GGACGGCCGA TGGAGAAGGC GGCTCAGCTG CACGTCGGCA CCGACCCGAT TCAGGCACCC 
CCGGCCGGCG GGGCGGGCCC TTCACTGGCC CCCGCCGGAA GCACCGTTGT CCCAACTGCG 
CAGATCATTT CAGAGGAGGC CTAG

Protein sequence

MTDQTSVIQD VQRGMIPAHI YNDKEIFELE KERLFGRSWL FVAHESEVPE AGDYVVRRVL 
EDSFIISRDE QGEIRALFNM CLHRGMQVCR AEMGNASHFR CPYHGWSYRN DGRIVGLPFH 
KEAYGGEEGF KKKGQTLLPA PSLGVYNGLI FISLDPDAEP LEDFLGDFKF YMDYYTKQSA 
DGIELRGPQR WRVKANWKIG AENFAGDMYH TPQTHTSVVE IGLFREPKAE KRKDGTTYWA 
GNGGGTTYKL PEGTLEDRLR YVGYPDDMIA RMKEQWSQEQ LDVVGKDGFM VSAASVFPNM 
SFVHNWPRVE EDSDEVLPFI SIRQWQPISE DETEIVSWFA VDKNASEEFK ALSYKAYLMC 
FGSGGMFEQD DVENWVSLTS TAGGPMARRL LLNSRMGMLE NGQNVVEPLT SDEYSGPGST 
RIGYSEYNQR ELLRRWADHL GRPMEKAAQL HVGTDPIQAP PAGGAGPSLA PAGSTVVPTA 
QIISEEA