Gene Arth_2472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2472
Symbol
ID	4445061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2769071
End bp	2770255
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	68%
IMG OID	639690287
Product	DNA protecting protein DprA
Protein accession	YP_831951
Protein GI	116671018
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.156193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGATC ATGAACGCAT AGCCCGTGCC GCCCTGTCGC GCCTAATGGA GCCGCAGGAC 
GCCGTCGGCC TGGCACTTGT CAGGACCGCC GGGGCAGTGG ACGGGCTCCG AATCGCCACA 
GGCCAACTGG TGTCCGGTCC GCAGCTTGAA CAGGAGGTCA CGGCTTTGCT TGCGGAGAAC 
GGGACAGCGA GCTGGCCCGG AATGAGCGCT TCGCTGAGGC GCTGGGCCCC GCGAATCCCG 
GACCTCGCTC CGGAGCGGGA TCTCGCCACC ATGCACCGGC TGGGCGGCCG GATGATCATG 
CCGTCCGATT CACTATGGCC CGGGCAGTTG GCCGACCTGG ACCTTCATGA GCCCATCTGC 
CTATGGTGGC GCGGAACGGA ACACCCACTG CCTGCGGCGG CCAAGTCCAT TGCCTTGGTC 
GGTTCCCGCG ACAGCACAAG CTATGGCGCG GCCGTCACGG GTGACTTGGC CTATTCGTTG 
GCGCAGCGGG GCTTTACCAT CGTGTCGGGC GGGGCTTACG GGATCGATGC GCACGCCCAC 
CGGGCCGCGC TGGCCGGTGC CGGCGACGCG ATGCCCACAA TAGCCGTCAT GGCCGGGGGA 
GTGGACCGCT TCTACCCGTC CGGCAACGAA GAACTGCTCA GGACCGTCGC GAACCAGGGT 
GCAGTCCTGG CTGAAGTACC GCCGGGCTCC GCCCCCACCA GGTACCGGTT CCTGCAACGG 
AACCGCCTTA TCGCCGCGCT GTCCTCAGTC ACCGTTGTGG TGGAGGCCCG GTGGCGCTCC 
GGTGCACTGA ACACGGCCCA CCACGCGGAG AGCCTGGGCA GGGCCGTCGG TGCCGTTCCC 
GGGTCCGTGC ATTCCGCAAA TTCCGCCGGG TGCCACCGGC TGATTCGGGA AGGGGGAGCC 
GTCTGCGTCA CGGACGCCGG CGAAATCGCG GAACTTGCCT CTTCCAGCGG CGAATCGTTG 
GCAGACGAGG CCCCGGCACA GAGTGCCGAT CATGACGGCC TTACCCTGGA GGACCTCATC 
CTCCTCGACG CACTGCCGCT CCGATCCACC AGCTCCGTCG AAAAGCTGAC GTCGGTCGCG 
GGACTGAGTA CTGACGCGGT CAGGGCCGGC CTGGGCAGGC TGGGGTTGCT GGGGCTTGCC 
GAATCCGAAC GCGGCGGCTG GAAACGGTCC CGGAAAGCCG GCTGA

Protein sequence

MTDHERIARA ALSRLMEPQD AVGLALVRTA GAVDGLRIAT GQLVSGPQLE QEVTALLAEN 
GTASWPGMSA SLRRWAPRIP DLAPERDLAT MHRLGGRMIM PSDSLWPGQL ADLDLHEPIC 
LWWRGTEHPL PAAAKSIALV GSRDSTSYGA AVTGDLAYSL AQRGFTIVSG GAYGIDAHAH 
RAALAGAGDA MPTIAVMAGG VDRFYPSGNE ELLRTVANQG AVLAEVPPGS APTRYRFLQR 
NRLIAALSSV TVVVEARWRS GALNTAHHAE SLGRAVGAVP GSVHSANSAG CHRLIREGGA 
VCVTDAGEIA ELASSSGESL ADEAPAQSAD HDGLTLEDLI LLDALPLRST SSVEKLTSVA 
GLSTDAVRAG LGRLGLLGLA ESERGGWKRS RKAG