Gene Arth_3451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3451
Symbol
ID	4443849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3883613
End bp	3884725
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	67%
IMG OID	639691275
Product	putative DNA alkylation repair protein
Protein accession	YP_832926
Protein GI	116671993
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGCCA TGAACGAACT GATTGACCAG GCCGCCGTCG GCCGGCTGGT TCGGGTCCTC 
GCGGACGCCG CCCCCGGGGC TTGCTGGTCC AACCTCGGCG ACGCAGGGTC TTCCCTGGGG 
AACCTGAGCC TTCGCGAACG CACCGATCAT GTGAGCCGGG GACTGCTCGC CGACTTTGCC 
GCTGCCGCCA GTCCGGCGGA CTATTCGACG GCGGCGCGCG TCTTCCGGAG CGCCCTCCTG 
GATCCTGGCT TCACCGGCTG GACGCTCTGG CCGGTTACGG AAACAGCGGT AACGCTGGCC 
TTGAATTCGA CCCGGTCCGC GGATTTTGAA GACTGCCTCC AGCTTCTGGC CGAACTGACT 
CCGCGGCTGA CCGGGGAATT CGCCATCCGG CGGATGCTGG CCGCCGACCT GGACCGTGCA 
CTCGCCGTCG TCCTGACCTG GACCGCCCAC CCTGACCAGC ATGTGCGCCG CCTCGCCAGC 
GAAGGCACCC GACCGTATCT CCCGTGGGCG GTCCGGATTC CCGGCCTGGT CCAGCGCCCG 
GACGCCACGA TTCCCATCCT GGACGCGCTC TACCGGGATC CACACGAGTA CGTCCGGCGT 
TCAGTGGCCA ATCACCTCAA CGACCTGGCA CGCCATTCTC CCGAGGCGGT GCTGGCCGCA 
GCTGCCGGCT GGACTGCCGC GCCGGACGCC AATACTCCGT GGGTGGTCCG GCATGGACTC 
CGCACCCTCG TGAAGAAGGC CCACCCGGGC GCACTGGCCC TGCAGGGGTT CGCTCCCGCG 
TCCCTCTCGG TATCCCCGCC GAGGCTGGAC CGGCACACCG TGGCCCTGCC GGCGGACCTC 
GCCTTCGAAT TCGAGATCTC CAACACGGGT GTCGATCCGG CCAGGCTCGC GGTGGATTAC 
ATCGTGCACT ACATGAAGGC AAACGGCTCA CAAACGGAGA AGGTCTTCAA ACTGGCGGCC 
CTGACCCTGA ATCCCGGCGA AACCCGGACA GTGTCCAAAC GCCATGCGTT CCGCCAGATG 
ACCACCCGGG TGCACCATCC GGGCAGCCAC GCTCTGGAGC TCCAGATCAA CGGCGTCCGG 
TACGCCCACA CGCAGTTCCT CGTCGAGATC TGA

Protein sequence

MGAMNELIDQ AAVGRLVRVL ADAAPGACWS NLGDAGSSLG NLSLRERTDH VSRGLLADFA 
AAASPADYST AARVFRSALL DPGFTGWTLW PVTETAVTLA LNSTRSADFE DCLQLLAELT 
PRLTGEFAIR RMLAADLDRA LAVVLTWTAH PDQHVRRLAS EGTRPYLPWA VRIPGLVQRP 
DATIPILDAL YRDPHEYVRR SVANHLNDLA RHSPEAVLAA AAGWTAAPDA NTPWVVRHGL 
RTLVKKAHPG ALALQGFAPA SLSVSPPRLD RHTVALPADL AFEFEISNTG VDPARLAVDY 
IVHYMKANGS QTEKVFKLAA LTLNPGETRT VSKRHAFRQM TTRVHHPGSH ALELQINGVR 
YAHTQFLVEI