Gene Arth_0801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0801
Symbol
ID	4446723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	865079
End bp	866602
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	71%
IMG OID	639688607
Product	molybdopterin binding domain-containing protein
Protein accession	YP_830299
Protein GI	116669366
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCTG CGCCGCCGGA CGGCGGTGAC GCCGCCAGCG ACGTTCCTGA CCACGGGGAA 
TCCTCCGGCC GCACCGCACC CGGCGCGGCT GAAGCCGGTG CCGGCACCGG TGCGCCCGAG 
GCCGACACAG GATCCCACGA TGCCGGGCAC ACCCATTTGG CGCACACCTG GCAGGAAGCC 
CGGCAGAGGT CATTCGATTG CGCCACACCC ATTCCGCCGG GACCGGTGCC GCTCAGGAGT 
GCGCTGGGCC GGACGCTCGC TGCCGATATT ACGGCGCTCC AGGATATGCC CCACTACGCT 
TCATCCGCCA TGGACGGCTG GGCAGTGAAC GGGACGGGGC CCTGGATTTT GGCCGAACCC 
GGCCAGAGGC TTGCGCCGCA CCAGGCCAGT CCCATCGTCA CCGGCGGCCT CATACCACCA 
GGGGCCAAGG CTGTGCTCCG CAGCGAAAGC GGCATGATCA CGACGGACGA CGAGGGGCTC 
CCCATCCTTG CCCTTGGTGG CGCAGCAAGG CCCGGTGAAC CGAAGAACGG CCAGCACATC 
CGGAAGGCAG GCGAGGAAGC GGCCGCCGGT GACGTCCTGG TCAAAAGCGG GGCAGTCCTC 
AACCCGGCCC ACCTGGCCCT CGCGGCACTG GCCGGCCACG ACTCCCTCCG GGTGCAGGGG 
AAACCTGTGG TCAGGATCCT GCTGACAGGC TCCGAGGTGG TTACCGCGGG CCTGCCTGCT 
CCGGGCAAGG TGCGCGACAC CTTCGGCCCG CAGCTTGGGG CTGTGGTCGA GATGCTCGGT 
GGGATCTGCG CCGGGCAAAA GAAAATAGGC GACGGCTACG ACGAATGGCT GGCTGCCCTG 
GAAGACGACG GACCGGAATC GGCCGGTCCG GCGGAGAAGA CCGTGCCGGA TGACGGCTCC 
GTGCTGTTGC CGGAAGAGCC GGTAGCGGAA GAAGCGCCTG CCGACGTCGT CATCACCACC 
GGCGGAACCG GCCGGTCCGG GACTGATCAC CTCCGCCGTG CAGTCGCGGA ACTGGGCGGC 
CGCCTGCTGA TCGACGGCAT CGCCATGCGC CCGGGACACC CGGCCGTCCT CGCCGAGCTG 
CCGGACGGCC GCTTCATCCT TGGCCTGCCG GGCAATCCCC TTGCCGCGAT GATGGCCCTC 
TGCACGGTGG GCGCGCCCCT GCTCGCCGCC CTTGGCCACG GAACCCTCCC TCCGGTCCAT 
GAGGTGCCCT GCGGCGCGAT GATCGAGGCT GATCCGGGGC GGACCCGGCT GATGCCCTTC 
AGGCTGCTGT ACGGGATGGC GTCCCCTGCC CGGCACGCGG GGCCCGGCAT GATGCGCGGT 
CTTGCTGCTG CCGACGGCGT CCTTGTTGTT CCGCCGCACG GCGTCCAGCT GGGCGAAGCG 
GTGCCCGCCT TCGCCTTGCC CTGGGGCGCT CCGATCCAGG CTGCGGAACC CGCCGCCGCG 
AAGGCCAAAG CCGCTCCCCG CAAGGCCCCG CGAAAGCCCT CAGCCTCGGA CGGGCCGGTG 
GACTGGAGTG CGCTGCTCGG CTAA

Protein sequence

MTAAPPDGGD AASDVPDHGE SSGRTAPGAA EAGAGTGAPE ADTGSHDAGH THLAHTWQEA 
RQRSFDCATP IPPGPVPLRS ALGRTLAADI TALQDMPHYA SSAMDGWAVN GTGPWILAEP 
GQRLAPHQAS PIVTGGLIPP GAKAVLRSES GMITTDDEGL PILALGGAAR PGEPKNGQHI 
RKAGEEAAAG DVLVKSGAVL NPAHLALAAL AGHDSLRVQG KPVVRILLTG SEVVTAGLPA 
PGKVRDTFGP QLGAVVEMLG GICAGQKKIG DGYDEWLAAL EDDGPESAGP AEKTVPDDGS 
VLLPEEPVAE EAPADVVITT GGTGRSGTDH LRRAVAELGG RLLIDGIAMR PGHPAVLAEL 
PDGRFILGLP GNPLAAMMAL CTVGAPLLAA LGHGTLPPVH EVPCGAMIEA DPGRTRLMPF 
RLLYGMASPA RHAGPGMMRG LAAADGVLVV PPHGVQLGEA VPAFALPWGA PIQAAEPAAA 
KAKAAPRKAP RKPSASDGPV DWSALLG