Gene Arth_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1643
Symbol
ID	4445835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1834409
End bp	1835770
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	70%
IMG OID	639689458
Product	deoxyribonuclease
Protein accession	YP_831137
Protein GI	116670204
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0120532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCCG AGACCCAGAC CCGCACGCAT ACCGAACTTG TGGTGGATAT CGGGCCCATC 
GCCCACGGCG GGCACTGCGT TGCCCGCCAC GAGGGCCGTG TGGTGTTTGT CCGCCACGCC 
ATCCCGGGCG AGAAGGTCCG GATCCGTCTG ACGGATGCCG GCGAGGACTC CAAATTTTGG 
CGAGCGGATG TTGTGGAAGT GCTCGAAGCA TCGCCCGACC GTATGCCCCA TTTCTGGCAT 
GTGGCGGATT CGCTTCGGGC ATGGTCGCAC GGGCACCCTC CGGTGGGCGG AGCCGAGCTG 
GGCCACGTGT CCCTTGGACG TCAGCGCAGC CTCAAGGCTG ACGTCCTGGC CGAACAGCTG 
AAGCGGCTCG CCGGCGTCGA ACGCGTCACG GAGGTGGAAG CTGTCGGCGC GGCCGCCGCC 
GCAGGCGACC ACAGCCCCGG TGCGCCCGGG CTGGGCTGGC GCACGCGGGC CAGCTTTGCC 
GTGACACCCG CCGGGAAGCT GGGCATGCAC GCGCACAGGT CCGACCAGGT CATTGCCATC 
CGCGAGATGC CATTGACCGT GTCCGCCATC AACGACCTCA GGCTTTGGGA CATCGACCTC 
GCGGGCGTCG AACGCGTTGA AGTGGCCGCG CCAGCCAACG GCTCGCGCCC GCTGGTCCTG 
CTGGCACCGG CCGAAGGAAC CCGCGCGAAG CGCCTTAGCG GGATCCTCGC GCAGCTTCCC 
GACGAGGTCT CGGTGGCGAG CTTCGATCCG GCCAAGGGCG AGTCGCTGCA GCTGCGCGGC 
CGCACCTGGG TGCAGGAGTC GGCCGCCGGG CACGAGTTCC GGGTCACGGG GGAGGGCTTC 
TGGCAGATCC ACCGGGATGC TCCGGAAACA CTAGTCGGGG CGCTTAAGGG ATTCCTGCAC 
GACGGCGGGT ACCTGGAGCC GGGCGCGGTG GTTGCGGACC TGTATGCCGG GGCGGGGCTG 
TTCACCGCAG CGCTTGCGGA CGCCGTTGGC GTGACCGGCT CCGTGCTGTC CGTTGAGGGT 
GCCCCCGGCA CCAGCCGGGA CGCGCGGAAG AACCTGCACG GGGCACCGCA GGTGGAAATT 
GTGCAGGGAC GCGTGGAACG GGTCCTGCGC CAGAAGCCAC GTAACTTCGA TGCCCTGGTG 
CTCGACCCGC CCCGCGCCGG CGCGGGCAAG GCAGTGGTCA GCCAGCTGAT GGCGGCCGGT 
CCCCGGGCCA TCGCCTACGT GTCCTGCGAT CCGGCGTCGT TCGCCCGGGA CCTGGGGTAC 
TTCCGGCAGG GAGGCTGGCA GCTCGCGGGG CTGCGGGCAT TCGACCTGTA CCCGCACACC 
CACCACATGG AGACAGTGGC GTTGCTGACG CCCCCGGCTT GA

Protein sequence

MNPETQTRTH TELVVDIGPI AHGGHCVARH EGRVVFVRHA IPGEKVRIRL TDAGEDSKFW 
RADVVEVLEA SPDRMPHFWH VADSLRAWSH GHPPVGGAEL GHVSLGRQRS LKADVLAEQL 
KRLAGVERVT EVEAVGAAAA AGDHSPGAPG LGWRTRASFA VTPAGKLGMH AHRSDQVIAI 
REMPLTVSAI NDLRLWDIDL AGVERVEVAA PANGSRPLVL LAPAEGTRAK RLSGILAQLP 
DEVSVASFDP AKGESLQLRG RTWVQESAAG HEFRVTGEGF WQIHRDAPET LVGALKGFLH 
DGGYLEPGAV VADLYAGAGL FTAALADAVG VTGSVLSVEG APGTSRDARK NLHGAPQVEI 
VQGRVERVLR QKPRNFDALV LDPPRAGAGK AVVSQLMAAG PRAIAYVSCD PASFARDLGY 
FRQGGWQLAG LRAFDLYPHT HHMETVALLT PPA