Gene Arth_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3520
Symbol
ID	4443830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3958367
End bp	3959836
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	68%
IMG OID	639691344
Product	hypothetical protein
Protein accession	YP_832995
Protein GI	116672062
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway) [COG0684] Demethylmenaquinone methyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAACAGG TCACCGACCA CCTCCTGGCC GCGGCCCGCA AAGTCATCGC GGTGCATATC 
AACTACCCCA GCCGGGCAGC CCAGCGCGGC CGCACTCCGG AGCAGCCCTC GTACTTCCTG 
AAGCCGTCCT CCTCCCTGGC GATCGGGTCG GCAGAAGCCC CTTCAACGGT GGAGCGCCCG 
GCCGGATGTG AGCTCCTCGG TTACGAAGGC GAGATCGCCC TGATCATCGG CAAGCCGGCC 
CGCCGCGTGG GCATCGAGGA CGCCTGGAGC CATGTCGAAT GGGTCACCGC CAGCAACGAC 
CTAGGCGTCT ACGACCTCCG CTACGCGGAC AAGGGCTCCA ACCTCCGTTC CAAGGGCGGG 
GACGGTTTCA CGCCGATCGG CCCGGGGCTG ATCGCCGCCG ACGCCGTGAA CCCCGCACAA 
CTGCGGATCC GCACCTGGCA TAACGGCGAA CTGGTCCAGG ACGACACCAC CGAAGACCTC 
CTCTTTCCGT TCGCCCGGCT CATCGCGGAC CTGTCCCAGC TGCTCACCCT CGAAGAGGGC 
GACATCATCC TCACCGGCAC CCCGGCCGGC GCTTCCGTCG CCAAGCCGGG CGACGTCATC 
GAGGTTGAAG TCAGCACTCC TGACGCGACC ACCGGGCGGC TGGCCACCCG GGTGGAGGAA 
GGCACGACGC CGTTCGCGGA CTTCGGCGCC CGCCCCAAGA CCGATGACCT CCAGCGGGAG 
GAAGCATACG GTTCGCGGGA AGCGGCCGGG CTTGCCGCCG TCGGACCTGT CCTCTCGCCG 
GAGCTGAAGG CCAAGCTGGA AAGCGTCTGC ACGGCCACGC TGTCCTCCCA GCTGCGCAAG 
CGCGGCCTGA ACAACGTCAG CATCGACGGC CTCACCTCAA CGCGTCCGGA GAAGCGGATC 
GTGGGCCTGG CCCGGACCCT GCGCTACGTG CCGAACCGCG AGGACCTCTT CAAGACCCAC 
GGCGGCGGCT TCAACGCCCA GAAGAAGGCC ATCGACTCGG TCAACGAGGG CGAAATCCTG 
GTGATGGAAG CCCGCGGCGA AAAGGGCACC GGCACCATCG GCGACATCCT GGCCCTCCGC 
GCCCAGGTCC GCGGCGCCGC CGCCGTCATC ACCGATGGCG GCGTCCGTGA CTTCTCCGCT 
GTGGCCGCCA TGGACATGCC CACGTACTAC TCCAACCCGC ACCCCGCGGT GCTGGGGCGC 
CGGCACATCC CGTGGGACAC CGACATCACG ATCGCCTGCG GCGGCACCAC CGTACAGCCC 
GGGGACATCA TCGTGGCCGA TGCGGACGGC ATCCTGGTGA TCCCGCCGGC CCTCGCCGAG 
GAGCTTGCGG ACGATTCCAT CGCCCAGGAA CGCGAGGAGG CGTTCATCGC CGAGATGGTG 
CAGCAGGGCC ACAGCGTGGA CGGCCTCTAC CCGTTGAACT CCGAATGGCG GGCCAAGTAC 
GACGAATGGG AAGGCCCCGC ACATGACTGA

Protein sequence

MEQVTDHLLA AARKVIAVHI NYPSRAAQRG RTPEQPSYFL KPSSSLAIGS AEAPSTVERP 
AGCELLGYEG EIALIIGKPA RRVGIEDAWS HVEWVTASND LGVYDLRYAD KGSNLRSKGG 
DGFTPIGPGL IAADAVNPAQ LRIRTWHNGE LVQDDTTEDL LFPFARLIAD LSQLLTLEEG 
DIILTGTPAG ASVAKPGDVI EVEVSTPDAT TGRLATRVEE GTTPFADFGA RPKTDDLQRE 
EAYGSREAAG LAAVGPVLSP ELKAKLESVC TATLSSQLRK RGLNNVSIDG LTSTRPEKRI 
VGLARTLRYV PNREDLFKTH GGGFNAQKKA IDSVNEGEIL VMEARGEKGT GTIGDILALR 
AQVRGAAAVI TDGGVRDFSA VAAMDMPTYY SNPHPAVLGR RHIPWDTDIT IACGGTTVQP 
GDIIVADADG ILVIPPALAE ELADDSIAQE REEAFIAEMV QQGHSVDGLY PLNSEWRAKY 
DEWEGPAHD