Gene Arth_1978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1978
Symbol
ID	4445492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2230510
End bp	2231676
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	63%
IMG OID	639689787
Product	cytochrome P450
Protein accession	YP_831459
Protein GI	116670526
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.449143
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTCG CCGCCGCCAA TGAGAACCCG CTGGATCCCT TCCCCTATTA CGAGCGAATG 
AGGGAAGCCG CACCCGTCTT CCACGACGAG CAATCGGGAA GTTGGCATGT CTTCAGGTAT 
GACGACGTGC AGCGGGTCCT GTCCGAATAC GCCACCTTTT CTTCCCGGAT GGGCGGCGAC 
GATCCTTCCG AGACAGGCCA GCTGTTCGCC TCGAGCCTGA TCACCACAGA TCCGCCGCGG 
CACCGTCATT TACGCTCGCT GGTGACCCAG GCGTTCACAC CGAAAGCCGT GGACGCGCTT 
GCTCCCCGCA TTTCGGAACT CACGGAAGAG CTTCTGGACG GGATCGTTTC CCGCGGTGGC 
GCCGACCTGA TCGAGGAGTT GGCGTACCCG CTGCCGGTTA TCGTGATTTC GGAACTCATG 
GGTATCCCCG CGGATGACCG GGACCGCTTC AAGCAGTGGT CCGATGTCAT CGTCAGCCAA 
ACGCGGACCA ATGCGGCAAC GGAAGACCAC CAGGCCACTA ACCGGGAAAT GACGGGATAC 
TTCCTGGACC TCATCGAACA GCGACGGCGG CGGCCCGGCG ACGACTTGAT CAGCAACCTG 
CTCAGCGCCG AGATTGACGG GCAGAAACTG AACGTGGCCG AACTGCTGGG CTTCTGCGCC 
CTGCTGCTCG TCGCCGGCAA CGAAACAACC ACGAACCTGA TCGGCAACGC GGTCCTTTGC 
TTTACCGAGG TGCCTGGCAC CATCGATCGG TTAGTGATGG AGCCGGCACT GCTCCCTCAG 
GCCATCGAAG AAGTGCTTCG CTTTCGGTCC CCGGTCCAGT CCATGTACCG GGTGACGGTC 
ACCGACACCA TCCTCGGCGA CGTTCAGATG CCTGCCGGCG CACCCGTGGT GGCGTGGATC 
GGCTCCGCAA ACCGCGACGA ACGGCAATTC CAACGCCCTG CCGAGTTCGA CGTCGACCGG 
GGCCAGATCC GTCACTTGGC ATTCGGCCAC GGCGTCCACT TCTGCCTCGG TGCGCCGCTT 
GCGAGGCTTG AAGCAAGGAT CGCACTGGAA GCCATCCTGT CCCGGCTGCC TGGACTGGCA 
CTCGCCCCGG GCGCGCACCT GGAACGGATG GACAGCACCA TTGTCTACGG GCTGAAGGCG 
CTGCCTGCGG GCTGGCAGGC AGCCTGA

Protein sequence

MDFAAANENP LDPFPYYERM REAAPVFHDE QSGSWHVFRY DDVQRVLSEY ATFSSRMGGD 
DPSETGQLFA SSLITTDPPR HRHLRSLVTQ AFTPKAVDAL APRISELTEE LLDGIVSRGG 
ADLIEELAYP LPVIVISELM GIPADDRDRF KQWSDVIVSQ TRTNAATEDH QATNREMTGY 
FLDLIEQRRR RPGDDLISNL LSAEIDGQKL NVAELLGFCA LLLVAGNETT TNLIGNAVLC 
FTEVPGTIDR LVMEPALLPQ AIEEVLRFRS PVQSMYRVTV TDTILGDVQM PAGAPVVAWI 
GSANRDERQF QRPAEFDVDR GQIRHLAFGH GVHFCLGAPL ARLEARIALE AILSRLPGLA 
LAPGAHLERM DSTIVYGLKA LPAGWQAA